905℃GPT-image-2 – OpenAI推出的下一代原生图像生成模型
GPT-image-2是什么GPT-image-2 是OpenAI推出的下一代原生图像生成模型,据传内部代号为「Spud」,目前已在ChatGPT进行灰度测试。模型于2026年4月初以maskingtape-alpha等代号短暂现身Cha...
899℃HappyOyster – 阿里推出的开放式世界模型产品
HappyOyster是什么HappyOyster是阿里ATH创新事业部推出的开放式世界模型产品,定位为可实时构建与交互的AI生成式体验平台。产品基于世界模型技术,支持无限延展的实时内容生成,官网开放了两种玩法Directing与Wand...
51℃StepAudio 2.5 TTS – 阶跃星辰推出的语境感知语音生成模型
StepAudio 2.5 TTS是什么StepAudio 2.5 TTS是阶跃星辰推出的Contextual TTS(语境感知语音合成模型),首次将语境理解能力引入语音生成全流程。模型通过Global Context(全局语境)定调整段...
920℃Relax – 小红书开源的大模型强化学习训练引擎
Relax是什么Relax 是小红书AI平台团队开源的面向全模态与 Agentic 场景设计的大模型强化学习训练引擎。基于 Megatron-LM 与 SGLang 构建,采用服务化容错架构(Ray Serve)与 TransferQue...
214℃有道宝库 – 网易有道推出的 AI 知识库工具
有道宝库是什么有道宝库是网易有道推出的首个AI知识库工具,定位为用户的外接超级知识库和AI研究助手。不同于传统聊天机器人或笔记工具,支持用户上传各类文档建立个人知识库,基于这些资料进行对话问答,能一键生成PPT、思维导图、播客脚本等多种格...
865℃Gemini 3.1 Flash TTS – 谷歌推出的文本转语音模型
Gemini 3.1 Flash TTS是什么Gemini 3.1 Flash TTS是Google推出的新一代文本转语音模型,提供更强的可控性、表现力和音质。模型支持70多种语言,引入音频标签技术,可通过自然语言指令精确控制声音风格、语...
924℃混元3D世界模型 2.0 – 腾讯混元开源的多模态世界模型
混元3D世界模型 2.0是什么混元3D世界模型 2.0(HY-World 2.0)是腾讯混元推出的开源多模态世界模型,支持从文本、单图、多视图或视频生成可漫游的3D高斯溅射(3DGS)场景。模型采用四阶段架构,全景生成→轨迹规划→世界扩展...
756℃ChatGPT代充值 – 3分钟支付宝、微信开通会员,亲测有效!
当我们用 ChatGPT 创作一篇紧急文案、调试一段复杂代码,或是向 AI 请教专业问题时,屏幕上突然弹出的已达到使用上限提示,像被泼了一盆冷水,浇灭了思路的火花,这确实是无数免费版用户的日常窘境。GPT-5 的强大能力近在咫尺,更快的响...
94℃Marble 1.1 – 李飞飞 World Labs 推出的新一代生成式世界模型
Marble 1.1是什么Marble 1.1 是李飞飞 World Labs 推出的新一代生成式世界模型,主打画质优化。模型能将单张图片、视频或全景图转化为可自由探索的沉浸式 3D 场景,显著改善光照效果与对比度,大幅减少过曝、泛白等视...
368℃MAI-Image-2-Efficient – 微软推出的轻量版文生图模型
MAI-Image-2-Efficient是什么MAI-Image-2-Efficient是微软推出的自研文生图模型,为MAI-Image-2的轻量高效版本,主打高性价比商业量产,在保持照片级真实图像质量的同时,实现成本降低41%、生成速...
820℃SearchClaw – 中国人民大学推出的 AI 深度研究智能体
SearchClaw是什么SearchClaw 是 RUC-NLPIR(中国人民大学信息检索实验室)推出的自托管式 AI 深度研究智能体,配备 Web 交互界面。用户提交问题后,系统自动执行多轮网络搜索、页面抓取、论文检索与内容综合,最终...
247℃OmniShow – 字节联合港中文、港大等开源的视频生成模型
OmniShow是什么OmniShow是字节跳动联合港中文、莫纳什、港大开源的多模态人-物交互视频生成模型。作为首个支持RAP2V(参考图+音频+姿势)的端到端框架,模型统一处理文本、图像、音频、姿势四种输入,单一12.3B参数模型即可生...
974℃Spark 2.0 – World Labs 开源的Web端 3D 高斯溅射渲染引擎
Spark 2.0是什么Spark 2.0是World Labs(李飞飞创立)开源的Web端3D高斯溅射渲染引擎,基于Three.js和WebGL2构建。Spark 2.0首创LoD细节层次系统、渐进式流式传输与虚拟内存技术,可在桌面、手...
500℃ERNIE-Image – 百度文心开源的文生图模型
ERNIE-Image是什么ERNIE-Image是百度文心团队开源的8B参数文生图模型,基于Diffusion Transformer架构,主打高可控性与精准长文本渲染。模型能准确生成中英双语海报、漫画、信息图等复杂视觉内容,解决文字模...
982℃GenieAI – 腾讯云 CodeBuddy 推出的 AI 应用生成平台
GenieAI 是什么GenieAI 是腾讯云 CodeBuddy 推出的 AI 编程平台,只需用自然语言描述需求,可自动生成网页应用、微信小程序、游戏、PPT 等完整产品。平台覆盖从构思、设计、开发到部署的全流程,生成包含前后端和数据库...
614℃谷歌 Gemma 4 本地部署指南,手机、Mac、OpenClaw免费用
前不久,谷歌推出了开源模型 Gemma 4 系列,一共有四个版本。Arena AI 开源排行榜全球第三,数学竞赛 AIME 2026 成绩 89.2%,编程能力 LiveCodeBench 80.0%。能调用工具、能写代码、能驱动Agen...
742℃OiiOii 教程 – 0 基础 AI 漫剧制作,全自动动画团队
很多人想做漫剧、做动画短剧起号赚流量,但一看到大佬们创作时如同蛛网般的手搓节点,当场就被劝退了。用常规 AI 视频工具又像在开盲盒,角色转个头长相全变了,为了凑几个连贯的镜头,反复抽卡,越干越心累。给大家看个视频,这是我用半小时生成的 A...
566℃Acrobat Student Spaces – Adobe 推出的 AI 学习平台
Acrobat Student Spaces是什么Acrobat Student Spaces 是 Adobe 推出的 AI 学习平台,专为帮助学生高效备考设计。平台能将课件、笔记等资料一键转化为闪卡、测验题、思维导图,生成播客和视频摘要...
457℃Mano-P 1.0 – 明略科技开源的 GUI-VLA 智能体模型
Mano-P 1.0是什么Mano-P 1.0是明略科技开源的GUI-VLA智能体模型,采用纯视觉驱动,无需API可直接操控桌面软件与网页界面。模型提供72B完整版与4B量化版,支持Apple M4芯片本地部署,实现数据零上云与物理隔离级...
18℃HeyGen CLI – HeyGen 推出的命令行工具
HeyGen CLI是什么HeyGen CLI是HeyGen官方推出的命令行工具与MCP服务器,基于Model Context Protocol协议构建。工具支持开发者及AI助手(如Claude、Cursor)通过自然语言直接调用HeyG...
181℃LibTV Seedance 2.0真人视频教程,0.35元/秒AI视频生成攻略
LibTV Seedance 2.0 支持真人模式了!Seedance 2.0 刚面世时,各大平台上 AI 二创视频爆火,和詹姆斯球场单挑、跟周星驰合拍电影让大家第一次见识到了 AI 视频生成的恐怖实力。但也因为效果太逼真,为了规避潜在的...
668℃实测扣子童锦程 Skill,打造 24 小时 AI 情感顾问
现在跟 AI 聊的越来越多,跟人却没什么话说了。遇到心动 Crush,只能憋出一句干巴巴的“在吗”暧昧对象忽冷忽热,每天都在猜“Ta 到底喜不喜欢我?”在感情里,往往就是当局者迷。如果有一个人能帮我们分析局势、一秒识破套路,指点迷津,那该...
786℃QinyanClaw – 沁言学术推出的云端学术科研智能体
QinyanClaw是什么QinyanClaw是沁言学术推出的全球首个为学术科研场景深度优化的云端智能体。基于OpenClaw架构,智能体具备长期记忆和自主执行能力,可7×24小时在云端独立运行,无需保持电脑在线。QinyanClaw能理...
721℃PokeClaw – 开源的全本地离线运行手机 AI Agent 应用
PokeClaw是什么PokeClaw(全称 PocketClaw)是开源 Android AI 自动化应用,由开发者 Nicole 独立打造。是首个实现完全本地离线运行的手机 AI 代理,基于 Google Gemma 4 模型通过 L...
768℃LPM 1.0 – 米哈游蔡浩宇推出的 AI 视频生成模型
LPM 1.0是什么LPM 1.0(Large Performance Model)是Anuttacon(蔡浩宇AI公司)推出的17B参数视频角色表演生成模型,支持实时全双工音视频对话。模型可将单图转化为能说话、倾听、反应且带细腻微表情的...
