Al项目

AI工具集介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。

325℃Qwen3.7-Plus – 阿里通义推出的智能体多模态大模型

Qwen3.7-Plus是什么Qwen3.7-Plus 是通义千问推出的新一代多模态大模型,将视觉与语言统一为一体化智能体基座。模型能感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码,支持端到端导航移动应用、结合网络知

282℃语构 – 阿里达摩院推出的 AI 原生开发平台

语构是什么语构是阿里达摩院推出的AI原生开发平台,以Vibe Coding为核心范式,让用户通过自然语言描述需求可生成完整可用的数字产品。平台覆盖从需求理解、智能追问、自动开发到预览发布的全链路,内置大模型对话、文生图

307℃Dubbing v2 – ElevenLabs 推出的 AI 配音模型

Dubbing v2是什么Dubbing v2 是 ElevenLabs 推出的 AI 配音模型,支持 29 种语言自动翻译配音,保留原始说话人音色与情感。模型提供双工作流模式,Auto Dub 快速生成预览,Dubbing Projec...

19℃Cosmos 3 – 英伟达开源的全模态物理 AI 基础大模型

Cosmos 3是什么Cosmos 3是英伟达推出的全球首款全开源全模态物理 AI 基础大模型,采用混合 Transformer 架构融合视觉推理、世界生成与动作预测能力。模型可原生理解并生成文本、图像、视频、音效及动作内容,物理仿真精

578℃Music v2 – ElevenLabs 推出的音乐生成大模型

Music v2是什么Music v2 是 ElevenLabs 全新推出的音乐生成大模型,在人声表现、乐器演奏和编曲水平上实现全面提升,支持多语言及单曲目内跨流派无缝转换。作为底层引擎,模型能驱动 ElevenMusic、ElevenA...

8℃Gamma-World – 英伟达推出的多智能体世界模型

Gamma-World是什么Gamma-World 是 NVIDIA 推出的多智能体世界模型,能解决多个智能体在同一个模拟世界中平等交互、全局一致的问题。模型创新性地采用单纯形旋转编码保证智能体身份对称,配合稀疏枢纽注意力将通信复杂度

394℃Hermes Desktop – Hermes Agent 的桌面应用,开箱即用

Hermes Desktop是什么Hermes Desktop 是开发者 sir1st 推出的 Hermes Agent 社区版桌面应用。将 Python 运行时、hermes-agent 核心与 hermes-web-ui 可视化界面打...

620℃Funloom – AI 原生游戏共创平台,简单描述生成完整游戏

Funloom是什么Funloom 是 00 后创业者吴同创立的 AI 原生游戏内容共创平台,让用户无需编程、美术或游戏引擎基础,通过简单的人物设定和世界观输入,可在五分钟内生成包含画面、音乐、地图和智能 NPC 互动的完整游戏。Funl

32℃墨见 – 墨刀推出的 AI 协作平台

墨见是什么墨见是墨刀推出的 AI 协作平台,专为一人公司与超级个体打造。平台搭载 OpenClaw 引擎,内置产品经理、UI/视觉设计师、前后端工程师、增长运营师等虚拟合伙人角色,支持 1 对 N 群聊协作模式。用户一句话愿景,可

249℃MiniMax M3 – MiniMax 推出的新一代 AI 模型

MiniMax M3是什么MiniMax M3是 MiniMax 推出的全新AI模型,具备领先的编程、Agent与长文本处理能力。模型采用创新的MSA稀疏注意力架构,支持1M超长上下文,效率提升20倍。同时原生支持图像、视频输入,可操控电...

925℃Qwen-VLA – 阿里通义推出的通用视觉-语言-动作模型

Qwen-VLA是什么Qwen-VLA 是通义实验室推出的通用视觉-语言-动作模型,以 Qwen3.5-4B 为视觉语言主干,搭配 1.15B 参数的 DiT 动作解码器。模型通过统一动作轨迹预测框架,将操作、导航、轨迹预测三大任务统一到...

504℃Webwright – 微软开源的终端原生网页智能体框架

Webwright是什么Webwright 是微软研究院开源的终端原生网页智能体框架,仅需约 1000 行代码可让 AI 模型在终端中编写 Playwright 代码、执行 bash 命令、查看日志并反复修正,完成复杂网页任务。Webwr...

356℃ControlFoley – 小米开源的可控视频音效生成模型

ControlFoley是什么ControlFoley是小米开源的可控视频音效生成模型,能解决V2A领域可控性难题。模型统一支持文本引导、文本控制与参考音频控制三类视频配音任务,通过自研时空音视频编码器CAV-MAE-ST、时间-音色解耦...

940℃OmniVoice Studio – 开源 AI 语音处理工具,ElevenLabs 平替

OmniVoice Studio是什么OmniVoice Studio 是全本地运行的开源 ElevenLabs 替代方案,提供跨平台桌面客户端,支持零样本语音克隆、声音设计、视频自动配音、语音听写等功能,覆盖 646 种语言。OmniV...

377℃美团GEO营销门户 – 美团推出的生成式引擎优化平台

美团GEO营销门户是什么美团 GEO 营销门户是美团推出的生成式引擎优化(GEO)平台,专为 AI 搜索时代设计,帮助品牌在豆包、DeepSeek、文心一言等主流大模型中提升曝光与推荐频次。与传统 SEO 优化搜索引擎排名不同,GEO 专...

597℃getdesign.md – VoltAgent 团队推出的 AI 原生设计系统库

getdesign.md是什么getdesign.md 是 VoltAgent 团队推出的 AI 原生设计系统库与工具平台,核心提供 60+ 顶级品牌的 DESIGN.md 设计规范文件。基于 Google Stitch 提出的 DESI...

344℃SenseNova-U1-8B-MoT-Infographic – 商汤科技开源的信息图增强模型

SenseNova-U1-8B-MoT-Infographic 是什么SenseNova-U1-8B-MoT-Infographic 是商汤科技开源的 8B 参数信息图增强模型,基于 SenseNova-U1-8B-MoT 统一架构,通过...

96℃阿里云百炼 CLI – 阿里云开源的 AI Agent 命令行工具

阿里云百炼 CLI是什么阿里云百炼CLI是阿里云开源的AI Agent命令行工具,专为智能体场景设计。开发者一行命令,可让Agent自动调用阿里云百炼平台150+多模态模型、10+应用及知识库、记忆、联网搜索等全套能力。原生兼容Cla

850℃Step 3.7 Flash – 阶跃星辰开源的新一代 Flash 模型

Step 3.7 Flash是什么Step 3.7 Flash 是阶跃星辰面向 Agent 生产化阶段推出的新一代开源 Flash 模型,采用稀疏 MoE 架构,最高生成速度达 400 Tokens/s。模型围绕 Agent、Coding...

870℃Hy-Memory – 腾讯混元推出的 Agent 记忆插件

Hy-Memory是什么Hy-Memory 是腾讯混元推出的专为 OpenClaw 等长期协作型 Agent 设计的记忆插件,通过 6 层记忆框架 × System1/System2 双系统 × 演化链三层架构,让 Agent 真正记得住...

788℃Dynamic Workflows – Claude Code 推出的动态工作流

Dynamic Workflows是什么Dynamic Workflows 是 Claude Code 推出的动态工作流,目前处于研究预览阶段,支持 Claude 动态编写编排脚本,在单次会话中并行调度数十至数百个子 Agent 协同工作...

666℃PilotDeck – 清华联合面壁智能开源的 Agent 操作系统

PilotDeck是什么PilotDeck 是清华大学THUNLP实验室、面壁智能、OpenBMB与AI9stars联合开源的智能体操作系统。PilotDeck以WorkSpace为核心设计范式,为每个项目建立独立的文件系统、记忆存储和技...

123℃Qwen-Image-Bench – 通义千问推出的文生图模型评测基准

Qwen-Image-Bench是什么Qwen-Image-Bench 是通义千问团队推出的文生图模型评测数据集,规模为 1k 条测试样本,覆盖中英双语提示,支持多维度评测各类文生图模型的生成效果,采用 Apache-2.0 协议开源。为...

561℃Claude Opus 4.8 – Anthropic 推出的旗舰级大语言模型

Claude Opus 4.8是什么Claude Opus 4.8 是 Anthropic 推出的旗舰级大语言模型,在 Opus 4.7 基础上提升判断力、诚实性和长时独立工作能力,在编程、智能体推理、多学科推理等基准测试中全面领先 GP...

70℃Wall-OSS-0.5 – 自变量机器人开源的国产具身智能模型

Wall-OSS-0.5是什么Wall-OSS-0.5是自变量机器人开源的国产具身智能模型,属于视觉-语言-动作(VLA)大模型,具备无需任务微调即可在真实机器人上部署的零样本能力。模型通过创新的Gradient-Bridge协同训练方法...