768℃LPM 1.0 – 米哈游蔡浩宇推出的 AI 视频生成模型

LPM 1.0是什么LPM 1.0(Large Performance Model)是Anuttacon(蔡浩宇AI公司)推出的17B参数视频角色表演生成模型,支持实时全双工音视频对话。模型可将单图转化为能说话、倾听、反应且带细腻微表情的...

878℃Trooly – AI Native用户研究平台,实时检测受访者情绪信号

Trooly是什么Trooly(元生万物)是AI-Native用户研究平台,通过多模态Voice Agent技术提供AI主导的深度访谈服务。平台能以12倍于传统调研机构的速度,在24小时内完成从方案设计、精准用户招募到深度访谈执行的全流程...

492℃TripStar – 开源 AI 旅行规划工具,多智能体协作规划旅行

TripStar是什么TripStar(旅途星辰)是基于HelloAgents框架的AI文旅智能体应用,通过LLM与多智能体协作解决旅行规划中的信息过载问题。工具深度集成小红书真实游记数据,智能提取景点、避坑指南与预约提醒,结合天气、酒店...

890℃MiniMax Music 2.6 – MiniMax 推出的全新 AI 音乐生成模型

MiniMax Music 2.6是什么MiniMax Music 2.6是MiniMax推出的全新AI音乐生成模型,实现从底层架构到创作体验的全维进化。该版本将首包延迟压缩至20秒内,突破性解决开盲盒痛点,实现精准的BPM锁定、精细的段...

627℃FIPO – 阿里通义推出的强化学习算法

FIPO是什么FIPO(Future-KL Influenced Policy Optimization)是阿里通义实验室推出的强化学习算法,通过Future-KL机制量化每个token对后续推理轨迹的影响力,实现token级精准信用分配...

230℃claude-code-best-practice – 开源的Claude Code系统化使用指南

claude-code-best-practice是什么claude-code-best-practice 是开源的 Claude Code 系统化使用指南。项目从氛围编程进阶到智能体工程,收录 86+ 条实战技巧,涵盖 Agents、C...

851℃智谱 GLM-5.1 开源实测:编程能力登顶 SWE-bench Pro

GLM-5.1 这么能打?!复杂软件工程超越 Claude Opus 4.6?!上月底,智谱 GLM-5.1 对所有 GLM Coding plan 用户开放。评论区直接变成了自来水现场,对很多程序员来说,GLM 早已是不可或缺的电子牛马...

705℃TapNow Seedance 2.0实测:《牌子》《纸手机》AI制作全流程开源

这几天 AI 视频神作频出。比如让人分不清现实和梦境的视觉神作《牌子》,全网播放量超 5000 万,一举斩获 B 站 AI 创作大赛冠军的百万大奖。甚至连《流浪地球》的郭帆,都在为他转发点赞。比如看哭全网的微电影《纸手机》,全片没有任何真...

824℃MMX-CLI – MiniMax 推出的全模态命令行工具

MMX-CLI是什么MMX-CLI 是 MiniMax 专为 AI Agent 打造的全模态命令行工具,支持文本、图像、视频、语音、音乐生成及视觉理解等能力。Agent 可在 Claude Code、OpenClaw 等环境直接调用,无需...

773℃ListenHub CLI – ListenHub 开源的AI内容创作命令行工具

ListenHub CLI是什么ListenHub CLI是开源的AI内容创作命令行工具,基于Node.js,支持在终端一键生成音乐、播客、PPT、语音及AI绘画。工具支持本地文件上传、JSON输出和异步模式,方便脚本集成与自动化工作流。...

298℃QBotClaw – 腾讯推出的国内首个浏览器原生AI智能体

QBotClaw是什么QBotClaw是腾讯推出的国内首个浏览器原生AI智能体,深度集成于QQ浏览器。用户无需下载安装,打开浏览器可通过自然语言指令让AI自动操控网页、跨软件执行任务,支持通过微信远程控制电脑。QBotClaw支持接入De...

668℃Seeduplex – 字节跳动推出的原生全双工语音大模型

Seeduplex是什么Seeduplex是字节跳动Seed团队推出的原生全双工语音大模型,实现边听边说的实时交互。模型能精准抗干扰(误打断率降50%)、动态判停(抢话率降40%),在嘈杂环境、多人对话等复杂场景下表现自然流畅。Seedu...

922℃VimRAG – 阿里通义开源的全模态知识库 RAG 框架

VimRAG是什么VimRAG是阿里通义实验室开源的全模态RAG框架,支持图文视频混合知识库。框架创新采用多模态记忆图(DAG)替代线性上下文,将推理建模为动态有向无环图实现路径可回溯。VimRAG通过图引导策略优化,精准剪枝无效路径并智...

978℃Octo – 即梦推出的 AI 原生动态叙事创作工具

Octo是什么Octo 是即梦推出的 AI 原生动态叙事创作工具,主打 Vibe Create(共感创作)理念。工具通过对话式交互与创作者深度协作,将 AI 从被动执行工具转变为创意合伙人。用户只需用自然语言描述想法,Octo 可协助完善...

542℃《Hermes Agent 从入门到精通》实战手册(PDF文件)

《Hermes Agent从入门到精通》是花叔编写的开源AI Agent实战手册,介绍Nous Research的Hermes Agent框架。核心特色是出厂自带缰绳:通过自改进学习循环、三层记忆(会话/持久/Skill)和自动进化的Sk...

157℃GO-2 – 智元机器人推出的具身智能基座大模型

GO-2是什么GO-2(Genie Operator-2)是智元机器人推出的第二代具身智能基座大模型,能打通理解-规划-执行链路,弥合语义与动作间的鸿沟。模型首创动作思维链直接在动作空间推理规划,结合异步双系统架构实现低频规划与高频执行的...

323℃SBTI测试 – B站UP主推出的网络人格测试,重新诠释MBTI

SBTI测试是什么SBTI测试是B站UP主「蛆肉儿串儿」推出的网络人格测试,用荒诞解构的方式重新诠释MBTI。测试包含31道题,输出27种戏谑人格标签如死者拿捏者吗喽等,精准戳中当代年轻人的自嘲与解压需求。测试通过极端情境模拟和反逻辑提问...

623℃MAI-Transcribe-1 – 微软推出的语音转文字模型

MAI-Transcribe-1是什么MAI-Transcribe-1是微软Azure AI Foundry推出的企业级语音转文字模型,支持中英日法等25种语言,模型在FLEURS基准测试中全面领先Whisper-large-v3。MAI...

299℃Wan2.7-Video – 阿里通义推出的 AI 视频创作模型

Wan2.7-Video是什么Wan2.7-Video是阿里通义实验室推出的AI视频创作大模型,支持文本、图像、视频、音频全模态输入。模型突破传统生成限制,实现像修图一样修视频的局部编辑、台词动作调整、运镜复刻、剧情续写等全流程创作。Wa...

281℃JoyAI-Image-Edit – 京东开源的指令引导图像编辑模型

JoyAI-Image-Edit是什么JoyAI-Image-Edit是京东开源的指令引导图像编辑模型,基于JoyAI-Image多模态基础模型构建。模型支持通过自然语言指令实现精确可控的空间操作与智能图像修改,具备多模态理解能力,可精准...

304℃叽伴APP深度体验:会等你的养成系赛博伙伴

这样的养成系 AI 谁能不爱呀?现在大部分 AI 都在卷生产力,AI 写代码、生成周报、总结 PDF似乎大家都默认,AI 的价值就该体现在效率提升上。直到最近我才发现 AI 也不一定非得干活,把 Ta 养成一个可爱的赛博伙伴也很有意思!当...

775℃InternSVG – 上海AI Lab推出的统一 SVG 建模套件

InternSVG是什么InternSVG是上海人工智能实验室等推出的面向统一SVG建模的“数据-评测-模型”综合套件,包含三大组件:超1600万样本的SAgoge数据集、标准化SArena评测基准,以及基于InternVL3-8B的统一...

117℃Gemma 4 – 谷歌开源的多模态大模型系列

Gemma 4是什么Gemma 4是Google开源的多模态大模型系列,基于Gemini 3架构。模型包含E2B/E4B(手机/树莓派可跑)、26B MoE(仅激活3.8B参数)和31B Dense(Arena评分开源第三)四个版本。模型...

7℃2026年最佳AI编程工具TOP 10:Cursor、TRAE、Claude Code到底怎么选?

写代码这件事,已经从"要不要用AI"变成了"用哪个AI"。2026年,AI编程工具遍地开花——从命令行智能体到AI原生IDE,从代码补全到全栈生成,选择太多反而让人纠结。这篇文

374℃ClawHub镜像站 – OpenClaw推出的中国官方镜像站点

ClawHub镜像站是什么ClawHub镜像站是OpenClaw推出的中国官方镜像站点,由字节跳动BytePlus与火山引擎提供基础设施支持。网站持续收录、加速ClawHub社区的高质量Agent Skill,解决国内访问原站速度慢的问题...