Al项目
AI工具集介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
555℃帧赞 – 智象未来推出的专业级AI影视创作与协作智能体
帧赞是什么帧赞是智象未来推出的全球首个专业级AI影视创作与协作智能体,定位为为专业团队而生的AI影视创作引擎。平台依托自研多模态大模型,打通剧本解析—分镜设计—画面生成—视频制作—AI粗剪—配音配乐全流程,支持导
554℃Agent Skills – 谷歌开源的 AI 编程 Agent 技能包
Agent Skills是什么Agent Skills 是谷歌 Gemini 团队主管 Addy Osmani 开源的 AI 编程 Agent 技能包。Agent Skills 将 Google 资深工程师的工作流与工程规范封装为 20 ...
399℃SenseNova U1 – 商汤日日新推出的原生统一多模态模型
SenseNova U1是什么SenseNova U1是商汤日日新基于NEO-Unify架构推出的原生统一多模态模型,在单一架构内实现理解、推理与生成。模型摒弃传统视觉编码器和VAE,构建统一表征空间,开源Lite版包含8B-MoT稠密模...
428℃CodeBanana – 出门问问推出的 AI 项目管理与协作平台
CodeBanana是什么CodeBanana 是出门问问推出的 AI 原生项目管理与协作开发系统,将即时沟通、Agent 执行与代码工作空间深度融合,定位为Slack + Jira + GitHub + AI 编程模型的一体化平台。平台...
732℃Nemotron 3 Nano Omni – 英伟达推出的多模态推理模型
Nemotron 3 Nano Omni是什么Nemotron 3 Nano Omni 是 NVIDIA Nemotron 3 模型系列,是专为 Agent 系统设计的开源高效多模态推理模型。模型采用 30B-A3B 混合 MoE 架构,...
203℃EAPO – 阿里通义推出的全新强化学习框架
EAPO是什么EAPO是阿里通义实验室推出的长文本推理强化学习框架,通过引入证据奖励机制,将监督信号从最终答案下沉到证据提取过程。框架已被ACL 2026录用,在8个权威长文本基准测试中,让30B模型反超120B的GPT-OSS及Clau...
739℃Tolaria – 开源本地AI笔记工具,融合 Notion 与 Obsidian
Tolaria是什么Tolaria 是面向 AI 时代的开源本地笔记工具,由 Refactoring 作者 Luca 基于 5 年全职写作、9000+ 笔记的管理经验打造。工具融合 Notion 的块编辑体验与 Obsidian 的本地数...
309℃TIPSv2 – 谷歌 DeepMind 开源的多模态模型
TIPSv2是什么TIPSv2 是 Google DeepMind 推出的多模态模型,模型通过 iBOT++、Head-only EMA 与多粒度文本增强三大创新,解决密集图像块与文本嵌入的精准对齐难题。模型覆盖 86M 至 1.1B 参...
429℃find-skill – Vercel Labs 推出的 Skill 搜索工具
find-skill是什么find-skills 是 Vercel Labs 推出的「元 Skill」,属于开放 Agent Skills 生态的核心组件。find-skills 内置于 vercel-labs/agent-skills ...
888℃guizang-ppt-skill – 开源网页 PPT生成 Skill,输出 HTML
guizang-ppt-skill是什么guizang-ppt-skill 是开源的 Claude Code / Claude Agent Skill,能将提示词转化为单文件 HTML 横向翻页PPT。guizang-ppt-skill ...
149℃GoSkill – 开源的长任务推进工具,内置重试循环与状态追踪
GoSkill是什么GoSkill 是面向长任务与复杂任务的推进工具。工具通过装饰器或类方式封装任务,将一次性 Skill 调用升级为围绕目标持续推进,直到满足成功标准或超时的执行模式。GoSkill适用需要明确验收标准、状态追踪和
26℃Claude Design系统提示词 – Anthropic 推出的完整核心提示词
Claude Design系统提示词是什么Claude Design系统提示词是Anthropic为Claude在Design模式下设定的核心指令文件,定义了AI作为专家设计师、用户作为经理的角色关系,规范HTML产物创建的标准流程,包含...
121℃免费 AI 外观专利检索神器,跨境卖家必备刚需
跨境卖家必囤的免费外观专利检索神器来了!无门槛注册即可每日免费 5 次图片检索,告别单次 1 元付费查专利的高额成本,省钱又高效。月亮树跨境专属专利检索服务,真正把免费做到极致,牢牢守住跨境合规底线。只要做跨境电商,月
86℃StepAudio 2.5 ASR – 阶跃星辰推出的自动语音识别模型
StepAudio 2.5 ASR是什么StepAudio 2.5 ASR 是阶跃星辰推出的新一代自动语音识别模型,专为语音转写、会议纪要与长音频处理设计。模型采用 Audio Encoder + Linear Adapter + 4B ...
476℃JVS Crew – 阿里云推出的企业级智能体构建平台
JVS Crew是什么JVS Crew 是阿里云推出的企业级智能体构建平台,用被集成为核心理念,支持企业零代码将 AI Agent 能力快速嵌入现有 App、SaaS 或智能硬件。平台采用 Agent-Environment-Sessio...
862℃GBrain – Y Combinator 总裁开源的个人生产级AI记忆系统
GBrain是什么GBrain 是 Y Combinator 总裁 Garry Tan 开源的个人生产级AI记忆系统,专为 OpenClaw、Hermes Agent 等 AI Agent 平台设计。工具把散落的 Markdown 笔记转...
242℃GPT-5.5 – OpenAI 推出的最新旗舰大模型
GPT-5.5是什么GPT-5.5 是 OpenAI 推出最新旗舰大模型,定位为迄今最智能、最直观的 AI 系统。模型在智能体编程、计算机使用、知识工作和科学研究四大领域实现显著跃升,Terminal-Bench 2.0 达 82.7%,...
277℃DeepSeek-V4 – DeepSeek推出的新一代大语言模型系列
DeepSeek-V4是什么DeepSeek-V4是DeepSeek推出的新一代大语言模型系列预览版,拥有百万字超长上下文窗口,在Agent能力、世界知识与推理性能方面达到开源领域领先水平。模型包含deepseek-v4-pro 和 de...
296℃Hy3 preview – 腾讯混元开源快慢思考融合的混合专家模型
Hy3 preview是什么Hy3 preview 是腾讯混元开源的快慢思考融合的混合专家模型,定位为迄今最智能的模型。模型采用 MoE 架构,用21B激活参数实现295B总参数规模,兼顾性能与推理成本。模型主打全面实用性,拒绝偏科,强调...
139℃多维秒搭 – 专为飞书多维表格推出的 AI 搭建工具
多维秒搭是什么多维秒搭是专为飞书多维表格推出的AI搭建工具,由前飞书团队创立,解决业务需求模糊到数据结构落地的核心痛点。用户只需用自然语言描述业务场景,AI可在90秒内自动完成字段设计、表间关联与数据结构推理。产
767℃鼎楷智影 – 鼎楷科技推出的一站式AI全流程视频制作平台
鼎楷智影是什么鼎楷智影(DKAI-DV)是鼎楷科技推出的一站式AI全流程视频制作平台,定位更懂创作人的AI工具。平台覆盖从故事创意、剧本生成到视觉呈现的全链路创作流程,支持镜头、脚本、画面、场景、角色、物品的自定义控制
359℃MiMo-V2.5 – 小米推出的全模态 Agent 大模型系列
MiMo-V2.5是什么MiMo-V2.5 是小米大模型团队推出的新一代全模态 Agent 大模型系列,包含 V2.5、V2.5-Pro、V2.5-TTS 及 V2.5-ASR 四个版本。MiMo-V2.5 为原生全模态 Agent,支持...
753℃Seed3D 2.0 – 字节跳动推出的新一代 3D 生成大模型
Seed3D 2.0是什么Seed3D 2.0 是字节跳动推出的新一代 3D 生成大模型,围绕几何精度与纹理材质质量进行了系统性架构升级,推动 3D 生成从可用迈向生产可用。模型采用 MoE 架构与 Coarse-to-Fine 两阶段生...
867℃Workspace Agents – OpenAI 推出的团队协作智能体
Workspace Agents是什么Workspace Agents 是 OpenAI 推出的团队协作智能体,基于 Codex 驱动运行在云端,可处理报告生成、代码编写、客户跟进等复杂工作流。Workspace Agents支持在 Ch...
947℃Qwen3.6-27B – 阿里通义开源的稠密多模态模型
Qwen3.6-27B是什么Qwen3.6-27B 是阿里通义千问团开源的 270 亿参数稠密多模态大模型,为 Qwen3.6 系列唯一的稠密架构版本。模型聚焦智能体编程与多模态推理,在 SWE-bench、Terminal-Bench ...
