Al项目

AI工具集介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。

234℃claude-code-best-practice – 开源的Claude Code系统化使用指南

claude-code-best-practice是什么claude-code-best-practice 是开源的 Claude Code 系统化使用指南。项目从氛围编程进阶到智能体工程,收录 86+ 条实战技巧,涵盖 Agents、C...

831℃MMX-CLI – MiniMax 推出的全模态命令行工具

MMX-CLI是什么MMX-CLI 是 MiniMax 专为 AI Agent 打造的全模态命令行工具,支持文本、图像、视频、语音、音乐生成及视觉理解等能力。Agent 可在 Claude Code、OpenClaw 等环境直接调用,无需...

774℃ListenHub CLI – ListenHub 开源的AI内容创作命令行工具

ListenHub CLI是什么ListenHub CLI是开源的AI内容创作命令行工具,基于Node.js,支持在终端一键生成音乐、播客、PPT、语音及AI绘画。工具支持本地文件上传、JSON输出和异步模式,方便脚本集成与自动化工作流。...

300℃QBotClaw – 腾讯推出的国内首个浏览器原生AI智能体

QBotClaw是什么QBotClaw是腾讯推出的国内首个浏览器原生AI智能体,深度集成于QQ浏览器。用户无需下载安装,打开浏览器可通过自然语言指令让AI自动操控网页、跨软件执行任务,支持通过微信远程控制电脑。QBotClaw支持接入De

670℃Seeduplex – 字节跳动推出的原生全双工语音大模型

Seeduplex是什么Seeduplex是字节跳动Seed团队推出的原生全双工语音大模型,实现边听边说的实时交互。模型能精准抗干扰(误打断率降50%)、动态判停(抢话率降40%),在嘈杂环境、多人对话等复杂场景下表现自然流畅。Seedu...

924℃VimRAG – 阿里通义开源的全模态知识库 RAG 框架

VimRAG是什么VimRAG是阿里通义实验室开源的全模态RAG框架,支持图文视频混合知识库。框架创新采用多模态记忆图(DAG)替代线性上下文,将推理建模为动态有向无环图实现路径可回溯。VimRAG通过图引导策略优化,精准剪枝无效路径

980℃Octo – 即梦推出的 AI 原生动态叙事创作工具

Octo是什么Octo 是即梦推出的 AI 原生动态叙事创作工具,主打 Vibe Create(共感创作)理念。工具通过对话式交互与创作者深度协作,将 AI 从被动执行工具转变为创意合伙人。用户只需用自然语言描述想法,Octo 可协助完善...

158℃GO-2 – 智元机器人推出的具身智能基座大模型

GO-2是什么GO-2(Genie Operator-2)是智元机器人推出的第二代具身智能基座大模型,能打通理解-规划-执行链路,弥合语义与动作间的鸿沟。模型首创动作思维链直接在动作空间推理规划,结合异步双系统架构实现低频规划与高频执行

327℃SBTI测试 – B站UP主推出的网络人格测试,重新诠释MBTI

SBTI测试是什么SBTI测试是B站UP主「蛆肉儿串儿」推出的网络人格测试,用荒诞解构的方式重新诠释MBTI。测试包含31道题,输出27种戏谑人格标签如死者拿捏者吗喽等,精准戳中当代年轻人的自嘲与解压需求。测试通过极端情境模

626℃MAI-Transcribe-1 – 微软推出的语音转文字模型

MAI-Transcribe-1是什么MAI-Transcribe-1是微软Azure AI Foundry推出的企业级语音转文字模型,支持中英日法等25种语言,模型在FLEURS基准测试中全面领先Whisper-large-v3。MAI...

303℃Wan2.7-Video – 阿里通义推出的 AI 视频创作模型

Wan2.7-Video是什么Wan2.7-Video是阿里通义实验室推出的AI视频创作大模型,支持文本、图像、视频、音频全模态输入。模型突破传统生成限制,实现像修图一样修视频的局部编辑、台词动作调整、运镜复刻、剧情续写等全流程创

285℃JoyAI-Image-Edit – 京东开源的指令引导图像编辑模型

JoyAI-Image-Edit是什么JoyAI-Image-Edit是京东开源的指令引导图像编辑模型,基于JoyAI-Image多模态基础模型构建。模型支持通过自然语言指令实现精确可控的空间操作与智能图像修改,具备多模态理解能力,可精准...

776℃InternSVG – 上海AI Lab推出的统一 SVG 建模套件

InternSVG是什么InternSVG是上海人工智能实验室等推出的面向统一SVG建模的“数据-评测-模型”综合套件,包含三大组件:超1600万样本的SAgoge数据集、标准化SArena评测基准,以及基于InternVL3-8B的统一...

121℃Gemma 4 – 谷歌开源的多模态大模型系列

Gemma 4是什么Gemma 4是Google开源的多模态大模型系列,基于Gemini 3架构。模型包含E2B/E4B(手机/树莓派可跑)、26B MoE(仅激活3.8B参数)和31B Dense(Arena评分开源第三)四个版本。模型...

9℃2026年最佳AI编程工具TOP 10:Cursor、TRAE、Claude Code到底怎么选?

写代码这件事,已经从"要不要用AI"变成了"用哪个AI"。2026年,AI编程工具遍地开花——从命令行智能体到AI原生IDE,从代码补全到全栈生成,选择太多反而让人纠结。这篇文

384℃ClawHub镜像站 – OpenClaw推出的中国官方镜像站点

ClawHub镜像站是什么ClawHub镜像站是OpenClaw推出的中国官方镜像站点,由字节跳动BytePlus与火山引擎提供基础设施支持。网站持续收录、加速ClawHub社区的高质量Agent Skill,解决国内访问原站速度慢的问题...

867℃Qwen3.6-Plus – 阿里通义推出的 Agent 编程模型

Qwen3.6-Plus是什么Qwen3.6-Plus是阿里通义实验室推出的 Agent 编程模型,主打编码智能体能力跃升。模型默认支持100万token超长上下文,在SWE-bench、Terminal-Bench等代码修复与终端自动化...

964℃claw-code – 开源的 Claude Code 源码重写项目

claw-code是什么claw-code 是Claude Code 源码泄露后推出的Clean-room Rewrite项目。作者为避免法律风险,使用 OpenAI Codex 的 OmX 工作流编排,仅用数小时将核心架构从 TypeS...

920℃GLM-5V-Turbo – 智谱AI推出的原生多模态Coding基座模型

GLM-5V-Turbo是什么GLM-5V-Turbo是智谱AI推出的原生多模态Coding基座模型,专为视觉编程和AI Agent设计。模型从预训练阶段深度融合视觉与文本能力,支持理解图片、视频、设计稿等多模态输入,上下文窗口达200k...

445℃叽伴 – 趣丸旗下推出的 AI 情感陪伴应用

叽伴是什么叽伴是趣丸旗下上海小煎饼科技推出的AI情感陪伴应用,主打真实羁绊。应用AI角色具备长期记忆,能记住你们的每一次冒险和建议,主动写手帐、寄信、送礼物,随陪伴不断成长变化。产品采用RPG化交互设计,支持世界地图

741℃Pada – AI角色聊天平台,支持多模态互动体验

Pada是什么Pada 是原问小白App 升级后的 AI 角色聊天平台。定位「AI 角色聊天与共创宇宙」,提供丰富的虚拟角色、沉浸式对话及多模态互动体验,主打与 AI 角色的情感陪伴与故事共创。平台支持创作者投稿角色并设有激励计

309℃小精龙 – 学而思推出的学生私人 AI 学伴 Agent

小精龙是什么小精龙是学而思推出的面向学生的AI智能学伴(Agent),基于OpenClaw架构打造。工具通过大脑映射持续理解学生的知识漏洞与思维习惯,将学习轨迹沉淀为私有财产(越用越懂学生),用学习伴侣身份提供个性化辅导与情感陪

923℃Wan2.7-Image – 阿里通义推出的 AI 图像生成与编辑模型

Wan2.7-Image是什么Wan2.7-Image是通义实验室推出的AI图像生成与编辑模型,支持深度自定义人物形象(脸型、眼型、骨相等),告别千篇一律的「AI标准脸」,可精准生成4000+字符及中文简繁体、英日韩德法等多种语言内容,告...

35℃updream – B 站推出的 AI 视频创作助手

updream是什么updream是B站官方推出的专业级AI视频创作助手,专为资深UP主打造。核心功能包括AI智能Agent、个性化技能库与自由创作画布,具备长期深度记忆能力,可持续学习创作者风格并沉淀为可复用技能。平台采用先内容后

166℃wecom-cli – 企业微信官方开源的命令行工具

wecom-cli 是什么wecom-cli(企业微信 CLI) 是企业微信官方团队开源的命令行工具,让人类和 AI Agent 能在终端中操作企业微信。工具覆盖通讯录、待办、会议、消息、日程、文档、智能表格 7 大核心能力,提供 12 ...