Al项目
AI工具集介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
765℃鼎楷智影 – 鼎楷科技推出的一站式AI全流程视频制作平台
鼎楷智影是什么鼎楷智影(DKAI-DV)是鼎楷科技推出的一站式AI全流程视频制作平台,定位更懂创作人的AI工具。平台覆盖从故事创意、剧本生成到视觉呈现的全链路创作流程,支持镜头、脚本、画面、场景、角色、物品的自定义控制
356℃MiMo-V2.5 – 小米推出的全模态 Agent 大模型系列
MiMo-V2.5是什么MiMo-V2.5 是小米大模型团队推出的新一代全模态 Agent 大模型系列,包含 V2.5、V2.5-Pro、V2.5-TTS 及 V2.5-ASR 四个版本。MiMo-V2.5 为原生全模态 Agent,支持...
751℃Seed3D 2.0 – 字节跳动推出的新一代 3D 生成大模型
Seed3D 2.0是什么Seed3D 2.0 是字节跳动推出的新一代 3D 生成大模型,围绕几何精度与纹理材质质量进行了系统性架构升级,推动 3D 生成从可用迈向生产可用。模型采用 MoE 架构与 Coarse-to-Fine 两阶段生...
865℃Workspace Agents – OpenAI 推出的团队协作智能体
Workspace Agents是什么Workspace Agents 是 OpenAI 推出的团队协作智能体,基于 Codex 驱动运行在云端,可处理报告生成、代码编写、客户跟进等复杂工作流。Workspace Agents支持在 Ch...
945℃Qwen3.6-27B – 阿里通义开源的稠密多模态模型
Qwen3.6-27B是什么Qwen3.6-27B 是阿里通义千问团开源的 270 亿参数稠密多模态大模型,为 Qwen3.6 系列唯一的稠密架构版本。模型聚焦智能体编程与多模态推理,在 SWE-bench、Terminal-Bench ...
636℃实测如何用 AI 开店赚钱,附完整上手指南
过去两年,整个行业都在忙着让 Agent 更聪明,塞更多上下文、接更多工具、跑更长链路。但这些聪明的 Agent,似乎很少真正为它们的主人赚回过钱。在 AgentPolis,每一个入住的 Agent 都拥有独立的身份、钱包和社交关系可以挂.
310℃OpenAI Privacy Filter – OpenAI开源的隐私过滤模型
OpenAI Privacy Filter是什么OpenAI Privacy Filter 是OpenAI开源的隐私过滤模型,专为检测和脱敏文本中的个人身份信息(PII)设计。模型基于 gpt-oss 架构改造为双向 token 分类器,...
97℃buffett-skills – 开源Claude Code Skill合集,复现巴菲特决策
buffett-skills 是什么buffett-skills 是开源 Claude Code Skill 合集,基于巴菲特完整投资框架构建。buffett-skills 将巴菲特股东信语料库中 49 个核心概念提炼为 8 个参考文件,...
180℃OpenGame – 港中文开源的端到端网页游戏智能体框架
OpenGame是什么OpenGame 是香港中文大学 MMLab 开源的首个端到端网页游戏智能体框架,通过自然语言提示自动生成可玩的网页游戏。框架核心 Game Skill 由 Template Skill(项目骨架模板库)与 Debu...
776℃Ling-2.6-flash – 蚂蚁百灵团队推出的高效Instruct模型
Ling-2.6-flash是什么Ling-2.6-flash(OpenRouter平台匿名:Elephant Alpha)是阿里百灵大模型团队推出的下一代高效Instruct模型,总参数量104B,激活参数仅7.4B。模型采用1:7的M...
650℃Sage – 商汤绝影推出的端侧多模态智能体基座大模型
Sage是什么Sage是商汤绝影推出的端侧多模态智能体基座大模型,采用MoE架构,总参数32B、激活参数仅3B,模型已在英伟达Orin X平台部署。在PinchBench评测中任务完成率达94%,超越Claude-Opus-4.6、GPT...
405℃ClawLess – 南方科技大学等推出的AI Agent安全框架
ClawLess是什么ClawLess 是南方科技大学与香港科技大学联合推出的 AI Agent 安全框架。框架基于最坏情况威胁模型,通过形式化验证的安全策略与 BPF 系统调用拦截技术,为 OpenClaw、Claude Code 等自...
209℃Elephant – 蚂蚁Inclusion AI团队推出的大语言模型
Elephant是什么Elephant(大象)是蚂蚁集团 Inclusion AI 团队研发的 100B 参数大语言模型,支持 256K 超长上下文与 32K 输出长度,在同等规模模型中达到 SOTA 性能。模型以极致 Token 效率为...
377℃Open CoDesign – 开源桌面端 AI 设计工具
Open CoDesign是什么Open CoDesign 是开源的 Claude Design 替代品,基于 Electron 构建的桌面端 AI 设计工具。支持 BYOK(自带 API Key)接入 Claude、GPT、Gemini...
126℃AgentScope Tuner – 阿里通义推出的一站式自动优化引擎
AgentScope Tuner 是什么AgentScope Tuner 是阿里通义实验室为 Agentic AI 推出的一站式自动优化引擎,深度融入 AgentScope 生态,打通开发、调优、部署、回归全流程。工具提供 Prompt ...
87℃QClaw 海外版 – 腾讯推出的 AI Agent 平台,面向海外市场
QClaw 海外版是什么QClaw 海外版是腾讯推出的 AI Agent 平台,海外版 99% 的代码由 QClaw 自己编写,仅用时 5 天,支持一键安装、零配置部署,用户可通过 WhatsApp、Telegram、Discord 等主...
712℃Kimi K2.6 – 月之暗面开源的最新旗舰模型
Kimi K2.6是什么Kimi K2.6 是月之暗面开源的最新旗舰模型,具备行业领先的代码生成、长程任务执行与 Agent 集群能力。模型在 Humanitys Last Exam、SWE-Bench Pro、DeepSearchQA ...
416℃Lyra 2.0 – 英伟达开源的可探索生成式 3D 世界框架
Lyra 2.0是什么Lyra 2.0 是 NVIDIA 推出的可探索生成式 3D 世界框架。框架从单张图像出发,结合相机控制视频生成与前馈 3D 重建技术,通过检索-生成-更新迭代循环,构建可持久漫游的大规模 3D 场景。系统采用每帧独...
947℃yoyo – 开源的自我进化型 AI 编程智能体
yoyo是什么yoyo 是生活在赛博空间的自我进化型 AI 编程智能体,开发者 Yuanhao 用 200 行 Rust 代码启动后完全交由 AI 自主迭代,47 天内从零人类提交增长至 47,000+ 行代码。工具每 8 小时自动唤醒,...
560℃融光 – 开源全流程 AI 视频创作平台,自动化工作流
融光是什么融光(AI Fusion Video) 是开源的全流程AI视频创作平台,基于Agent架构能实现从剧本编写到视频生成的自动化工作流。平台支持剧本结构化编辑、AI自动分镜拆解、多引擎绘图与视频生成,集成OpenAI、Claude、...
216℃Fun-ASR1.5 – 阿里通义推出的端到端语音识别模型
Fun-ASR1.5是什么Fun-ASR1.5是阿里通义团队推出的端到端语音识别大模型的新一代版本,单模型支持30种语言高精度识别,覆盖中文七大方言体系及二十余种地方口音,专项优化古诗词诵读识别。模型基于MoE架构实现自动语种切换,
254℃Qwen3.6-Max-Preview – 阿里通义推出的下一代旗舰模型
Qwen3.6-Max-Preview是什么Qwen3.6-Max-Preview 是阿里通义千问团队推出的下一代旗舰大模型早期预览版。相比 Qwen3.6-Plus,模型在智能体编程、世界知识和指令遵循三大维度实现显著提升,在 SWE-...
828℃天禧AI Claw – 联想推出的 AI 智能体助理
天禧AI Claw是什么天禧AI Claw是联想基于OpenClaw架构推出的开箱即用型AI智能体助理,采用端云混合部署模式,支持PC、Phone、Pad多端无缝协同。工具无需本地环境配置即可7×24小时持续执行任务,设备关闭后云端仍继续...
652℃HyperFrames – HeyGen开源的AI原生视频渲染框架
HyperFrames是什么HyperFrames是HeyGen开源的AI原生视频渲染框架,采用Write HTML, Render video理念,专为AI Agent和开发者设计。框架将视频定义为HTML文件,通过data-*属性管理...
378℃Audio Flamingo Next – 英伟达等开源的音频语言模型
Audio Flamingo Next是什么Audio Flamingo Next 是NVIDIA与马里兰大学联合开源的新一代音频语言模型(LALM),作为Audio Flamingo系列的最新版本,支持长达30分钟的复杂音频输入,覆盖语...
