Al项目
AI工具集介绍和收录了当前流行的AI研究项目和框架,紧跟最新AI领域的进展,解读AI研究论文和方法框架,帮你快速了解这些项目的工作原理。
414℃Horizon – 开源 AI 信息聚合系统,构建专属新闻雷达
Horizon是什么Horizon 是开源的 AI 驱动信息聚合系统,帮助用户构建专属的 AI 新闻雷达。工具支持从 RSS、Hacker News、GitHub、Reddit、Telegram、Twitter/X 等多源抓取信息,通过 ...
182℃FreeLLMAPI – 开源 AI 模型聚合平台,统一OpenAI兼容格式
FreeLLMAPI是什么FreeLLMAPI 是开源的 OpenAI 兼容代理服务,可将约 14 家 AI 服务商的免费额度聚合为单一 API 端点,每月总计约 13 亿 tokens 的免费推理额度。项目基于 TypeScript/E...
698℃Octask – 光魔科技推出的 AI 内容工作室平台
Octask是什么Octask 是深圳光魔科技(MagicLight 团队)推出的 AI 内容工作室平台。将 AI 能力具象化为可协作的数字员工,用户以Boss身份组建专属 AI 团队,在一个平台内完成选题研究、文案撰写、图片生成、视频策...
675℃Mega-ASR – NTU、NUS、上海AI Lab开源的语音识别模型
Mega-ASR是什么Mega-ASR 是南洋理工大学(NTU)、新加坡国立大学(NUS)与上海人工智能实验室联合开源的全场景鲁棒语音识别基座模型,模型以 Qwen3-ASR 1.7B 为底层架构,针对真实世界中复杂声学环境(如噪音、远场...
541℃CodeGraph – 开源代码知识图谱工具,加速代码理解和分析
CodeGraph是什么CodeGraph 是面向 AI 编码代理的预索引代码知识图谱工具,通过 MCP 协议与 Claude Code、Cursor、Codex CLI、OpenCode 及 Hermes Agent 深度集成。利用 t...
408℃SenseNova-Skills – 商汤团队开源的模块化 AI 办公技能库
SenseNova-Skills是什么SenseNova-Skills 是 OpenSenseNova(商汤)团队开源的模块化 AI 办公技能库,专为 Agent 运行时设计。工具将信息图生成、PPT 制作、Excel 数据分析与深度研究...
387℃LLM Council – Karpathy 开源的多模型协作框架
LLM Council是什么LLM Council 是 Andrej Karpathy 开源的多模型协作框架,通过 OpenRouter 将用户问题同时分发给多个大模型(如 Claude、GPT、Gemini 等)独立作答,各模型匿名互评...
993℃Confucius4 – 网易有道开源的多模态推理模型
Confucius4是什么Confucius4是网易有道AI团队基于Qwen3.5-27B架构推出的开源多模态大模型,专为高级数学推理场景设计。模型通过迭代SFT+RL训练范式、纯文本推理数据增强及精细化CoT优化,在同等规模模型中达到S...
142℃陪读蛙 – 开源的 AI 翻译浏览器扩展工具
陪读蛙是什么陪读蛙(ReadFrog)是开源的 AI 沉浸式翻译浏览器扩展工具。工具能翻译和解读浏览器上的任何内容,支持Chrome、Edge、Firefox。通过上下文感知翻译、划词解析、TTS朗读等功能,帮助用户在真实网页中边读边学。..
432℃Stable Audio 3 – Stability AI 开源的音频生成模型系列
Stable Audio 3是什么Stable Audio 3是Stability AI推出的新一代开源音频生成模型系列,基于流匹配潜空间扩散架构,支持文本转音乐与音效、音频编辑及续写。Stable Audio 3提供Small、Medi...
856℃autoresearch – Karpathy 开源的 AI 自主科研实验框架
autoresearch是什么autoresearch 是 Andrej Karpathy 开源的 AI 自主科研实验框架。框架让 AI Agent 在单张 GPU 上自动运行 nanochat 训练实验,自主调参、执行训练、分析验证指标...
1001℃LongCat-Video-Avatar 1.5 – 美团开源的数字人视频生成模型
LongCat-Video-Avatar 1.5是什么LongCat-Video-Avatar 1.5 是美团 LongCat 开源的音频驱动数字人视频生成框架。模型基于 13.6B 参数的基础视频生成模型 LongCat-Video 构...
945℃GLM-5.1-highspeed – 智谱AI推出的 GLM-5.1 高速版 API
GLM-5.1-highspeed是什么GLM-5.1-HighSpeed是智谱AI推出的旗舰级高速大模型API,在完整保留GLM-5.1综合能力的基础上,通过TileRT高性能推理引擎实现400 tokens/s的输出速度,刷新全球大模...
323℃Hy-MT2 – 腾讯混元开源的新一代翻译大模型
Hy-MT2是什么Hy-MT2是腾讯混元开源的新一代翻译大模型,提供 1.8B、7B、30B-A3B 三个尺寸,支持 33 种语言互译及 5 种民汉/方言翻译。其中 7B 和 30B-A3B 在多项评测中达到开源模型最佳效果,超越数十倍参...
202℃Hy 翻译 – 腾讯混元团队推出的 AI 翻译小程序
Hy 翻译是什么Hy 翻译是腾讯混元团队基于自研 Hy-MT2 大模型推出的 AI 翻译小程序,支持 33 种语言互译与 5 种民汉方言。工具提供 9 种预设翻译风格与个性化指令设定,覆盖学术、商务、旅游等多场景,同时支持语音输入与 4
560℃CloudDM – ClouGence 团队开源的数据库研发与管控平台
CloudDM是什么CloudDM 是 ClouGence 团队开源的数据库研发与管控平台。CloudDM将数据查询、SQL 审核、权限管控等数据库核心能力集成于统一平台,支持 30 种数据源,覆盖 MySQL、PostgreSQL、Cl...
987℃微伴 Claw – 微伴助手推出的企业微信 AI 数字员工
微伴 Claw是什么微伴Claw是微伴助手基于 OpenClaw 推出的企业微信AI数字员工,常驻企微环境,通过自然语言连接客户、标签、群发、朋友圈、积分评分、表单等私域数据,实现客户分析、策略匹配、内容生成与执行推进,将分散的
660℃2026 十大专业数据采集服务选择指南
在数据驱动决策的时代,数据采集作为数据价值链的起点,其效率、质量与合规性直接决定了后续数据分析与应用的效果。当前大部分数据采集服务商,支持用户自主配置规则抓取公开数据,提供成品数据集、定制化采集及标注等全链条
50℃Agora-1 – Odyssey 推出的首款多智能体世界模型
Agora-1是什么Agora-1 是 Odyssey 推出的首款多智能体世界模型,支持人类与 AI 在同一实时生成的世界模拟中互动。模型以经典 FPS 游戏 GoldenEye 007 为研究场景,最多支持 4 名参与者共享死亡竞赛体验...
650℃HyperEyes – 小红书联合剑桥推出的并行多模态搜索智能体
HyperEyes是什么HyperEyes是小红书与剑桥大学联合推出的并行多模态搜索智能体,首创 UGS 范式,将视觉定位与检索融合为单一原子动作,实现单轮多实体并发搜索。HyperEyes采用双粒度效率感知强化学习框架,在6个基准测试中...
739℃ZCube – 智谱AI联合清华推出的下一代大模型推理网络架构
ZCube是什么ZCube是智谱AI联合驭驯网络与清华大学推出的下一代大模型推理网络架构,专为解决PD分离部署中的结构性网络拥塞设计。架构取消传统Spine层交换机,采用全网扁平化拓扑与单/多轨混合接入机制,实现全局流量解耦与
617℃Gemini 3.5 Flash – Google 推出的新一代 AI 大模型
Gemini 3.5 Flash是什么Gemini 3.5 Flash 是 Google 推出的新一代AI大模型,以前沿智能+行动能力为核心定位。模型在 Terminal-Bench 2.1 编码基准得分 76.2%、GDPval-AA ...
122℃Gemini Spark – 谷歌推出的个人 AI Agent
Gemini Spark是什么Gemini Spark 是 Google 推出的 24/7 个人 AI Agent,基于 Gemini 3.5 模型与 Antigravity 框架运行,深度集成 Gmail、Docs、Slides 等 W...
607℃Gemini Omni Flash – 谷歌推出的多模态视频生成模型
Gemini Omni Flash是什么Gemini Omni Flash 是 Google I/O 大会推出的视频生成模型,定位从任意输入生成任意输出的统一多模态生成模型。模型将 Gemini 推理能力与 Veo 视频、Nano Ba...
271℃Google Pics – 谷歌推出的 AI 图像创建与编辑工具
Google Pics是什么Google Pics 是谷歌基于最新 Nano Banana 模型推出的 AI 图像创建与编辑工具,深度集成于 Google Workspace 生态。工具将图像中的每个元素视为独立对象,支持对特定细节进行精...
