Al项目

AI工具集介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。

820℃Step Image Edit 2 – 阶跃星辰推出的图像生成编辑模型

Step Image Edit 2是什么Step Image Edit 2 是阶跃星辰推出的新一代轻量级图像生成编辑模型,参数量仅 3.5B,能在实际表现中超越 12B-20B 级开源大模型。模型单次生图耗时 0.5-2 秒,主打极速响应...

280℃天狼星AI标书 – AI标书辅助平台,从解析到生成一站式解决

天狼星AI标书是什么天狼星AI标书是湖南天狼星智能科技推出的智能投标辅助平台,专为投标人提供从招标文件解析到标书生成的一站式AI解决方案。产品融合DeepSeek、Kimi、豆包、文心一言等主流大模型与自研10W+标书训练模

403℃星火X2-Flash – 科大讯飞推出的MoE架构大语言模型

星火X2-Flash是什么星火X2-Flash是科大讯飞发布的MoE架构大语言模型,总参数30B,支持256K超长上下文,基于华为昇腾910B国产算力集群训练。模型专为Agent时代设计,在智能体任务执行、代码生成、深度研究等场景表现接近...

5℃打破算力壁垒!蚂蚁灵波开源 LingBot-Fast,你的手机秒变“超级大脑”

在AI大模型狂飙突进的今天,很多人都有一个错觉:想要玩转AI,要么得花大价钱充值云端API,要么得拥有一台配有顶级显卡的台式机。然而,“蚂蚁灵波”团队最近交出了一份让

501℃金山办公发布新一代WPS多维表格引擎,企业协同迈入毫秒级时代

4 月 22 日,金山办公在 WPS AI NEXT 武汉站活动中,正式发布新一代 WPS 多维表格,首次对外披露了其在高并发场景下的实测性能指标。面对企业数字化长尾场景多、协同效率不足的行业痛点,金山办公将多维表格作为AI时代补齐传

552℃帧赞 – 智象未来推出的专业级AI影视创作与协作智能体

帧赞是什么帧赞是智象未来推出的全球首个专业级AI影视创作与协作智能体,定位为为专业团队而生的AI影视创作引擎。平台依托自研多模态大模型,打通剧本解析—分镜设计—画面生成—视频制作—AI粗剪—配音配乐全流程,支持导

552℃Agent Skills – 谷歌开源的 AI 编程 Agent 技能包

Agent Skills是什么Agent Skills 是谷歌 Gemini 团队主管 Addy Osmani 开源的 AI 编程 Agent 技能包。Agent Skills 将 Google 资深工程师的工作流与工程规范封装为 20 ...

397℃SenseNova U1 – 商汤日日新推出的原生统一多模态模型

SenseNova U1是什么SenseNova U1是商汤日日新基于NEO-Unify架构推出的原生统一多模态模型,在单一架构内实现理解、推理与生成。模型摒弃传统视觉编码器和VAE,构建统一表征空间,开源Lite版包含8B-MoT稠密模...

426℃CodeBanana – 出门问问推出的 AI 项目管理与协作平台

CodeBanana是什么CodeBanana 是出门问问推出的 AI 原生项目管理与协作开发系统,将即时沟通、Agent 执行与代码工作空间深度融合,定位为Slack + Jira + GitHub + AI 编程模型的一体化平台。平台...

730℃Nemotron 3 Nano Omni – 英伟达推出的多模态推理模型

Nemotron 3 Nano Omni是什么Nemotron 3 Nano Omni 是 NVIDIA Nemotron 3 模型系列,是专为 Agent 系统设计的开源高效多模态推理模型。模型采用 30B-A3B 混合 MoE 架构,...

200℃EAPO – 阿里通义推出的全新强化学习框架

EAPO是什么EAPO是阿里通义实验室推出的长文本推理强化学习框架,通过引入证据奖励机制,将监督信号从最终答案下沉到证据提取过程。框架已被ACL 2026录用,在8个权威长文本基准测试中,让30B模型反超120B的GPT-OSS及Clau...

736℃Tolaria – 开源本地AI笔记工具,融合 Notion 与 Obsidian

Tolaria是什么Tolaria 是面向 AI 时代的开源本地笔记工具,由 Refactoring 作者 Luca 基于 5 年全职写作、9000+ 笔记的管理经验打造。工具融合 Notion 的块编辑体验与 Obsidian 的本地数...

307℃TIPSv2 – 谷歌 DeepMind 开源的多模态模型

TIPSv2是什么TIPSv2 是 Google DeepMind 推出的多模态模型,模型通过 iBOT++、Head-only EMA 与多粒度文本增强三大创新,解决密集图像块与文本嵌入的精准对齐难题。模型覆盖 86M 至 1.1B 参...

427℃find-skill – Vercel Labs 推出的 Skill 搜索工具

find-skill是什么find-skills 是 Vercel Labs 推出的「元 Skill」,属于开放 Agent Skills 生态的核心组件。find-skills 内置于 vercel-labs/agent-skills ...

886℃guizang-ppt-skill – 开源网页 PPT生成 Skill,输出 HTML

guizang-ppt-skill是什么guizang-ppt-skill 是开源的 Claude Code / Claude Agent Skill,能将提示词转化为单文件 HTML 横向翻页PPT。guizang-ppt-skill ...

147℃GoSkill – 开源的长任务推进工具,内置重试循环与状态追踪

GoSkill是什么GoSkill 是面向长任务与复杂任务的推进工具。工具通过装饰器或类方式封装任务,将一次性 Skill 调用升级为围绕目标持续推进,直到满足成功标准或超时的执行模式。GoSkill适用需要明确验收标准、状态追踪和

24℃Claude Design系统提示词 – Anthropic 推出的完整核心提示词

Claude Design系统提示词是什么Claude Design系统提示词是Anthropic为Claude在Design模式下设定的核心指令文件,定义了AI作为专家设计师、用户作为经理的角色关系,规范HTML产物创建的标准流程,包含...

119℃免费 AI 外观专利检索神器,跨境卖家必备刚需

跨境卖家必囤的免费外观专利检索神器来了!无门槛注册即可每日免费 5 次图片检索,告别单次 1 元付费查专利的高额成本,省钱又高效。月亮树跨境专属专利检索服务,真正把免费做到极致,牢牢守住跨境合规底线。只要做跨境电商,月

84℃StepAudio 2.5 ASR – 阶跃星辰推出的自动语音识别模型

StepAudio 2.5 ASR是什么StepAudio 2.5 ASR 是阶跃星辰推出的新一代自动语音识别模型,专为语音转写、会议纪要与长音频处理设计。模型采用 Audio Encoder + Linear Adapter + 4B ...

474℃JVS Crew – 阿里云推出的企业级智能体构建平台

JVS Crew是什么JVS Crew 是阿里云推出的企业级智能体构建平台,用被集成为核心理念,支持企业零代码将 AI Agent 能力快速嵌入现有 App、SaaS 或智能硬件。平台采用 Agent-Environment-Sessio...

860℃GBrain – Y Combinator 总裁开源的个人生产级AI记忆系统

GBrain是什么GBrain 是 Y Combinator 总裁 Garry Tan 开源的个人生产级AI记忆系统,专为 OpenClaw、Hermes Agent 等 AI Agent 平台设计。工具把散落的 Markdown 笔记转...

240℃GPT-5.5 – OpenAI 推出的最新旗舰大模型

GPT-5.5是什么GPT-5.5 是 OpenAI 推出最新旗舰大模型,定位为迄今最智能、最直观的 AI 系统。模型在智能体编程、计算机使用、知识工作和科学研究四大领域实现显著跃升,Terminal-Bench 2.0 达 82.7%,...

275℃DeepSeek-V4 – DeepSeek推出的新一代大语言模型系列

DeepSeek-V4是什么DeepSeek-V4是DeepSeek推出的新一代大语言模型系列预览版,拥有百万字超长上下文窗口,在Agent能力、世界知识与推理性能方面达到开源领域领先水平。模型包含deepseek-v4-pro 和 de...

294℃Hy3 preview – 腾讯混元开源快慢思考融合的混合专家模型

Hy3 preview是什么Hy3 preview 是腾讯混元开源的快慢思考融合的混合专家模型,定位为迄今最智能的模型。模型采用 MoE 架构,用21B激活参数实现295B总参数规模,兼顾性能与推理成本。模型主打全面实用性,拒绝偏科,强调...

137℃多维秒搭 – 专为飞书多维表格推出的 AI 搭建工具

多维秒搭是什么多维秒搭是专为飞书多维表格推出的AI搭建工具,由前飞书团队创立,解决业务需求模糊到数据结构落地的核心痛点。用户只需用自然语言描述业务场景,AI可在90秒内自动完成字段设计、表间关联与数据结构推理。产