融光是什么
融光(AI Fusion Video) 是开源的全流程AI视频创作平台,基于Agent架构能实现从剧本编写到视频生成的自动化工作流。平台支持剧本结构化编辑、AI自动分镜拆解、多引擎绘图与视频生成,集成OpenAI、Claude、Gemini等主流大模型,采用Java 21 + Spring Boot 3.5后端与Next.js 16前端技术栈,支持Docker一键部署,帮助内容创作者高效完成视频制作。

融光的主要功能
剧本管理:平台能创建和编辑视频剧本,支持分集/分场景结构化管理。
AI分镜生成:AI自动将剧本拆解为可视化分镜,包含画面描述与镜头语言。
AI绘图:集成多家AI绘图引擎,一键生成分镜参考图。
AI视频生成:基于分镜描述和参考图生成视频片段。
素材管理:统一管理项目内的图片、视频等素材资源。
多模型支持:集成OpenAI、Claude、Gemini、通义千问、DeepSeek、Ollama等主流大模型。
如何使用融光
环境准备:安装Docker(推荐方式)或配置JDK 21+、Node.js 20+、pnpm 9+、MySQL与Redis环境。
项目获取:执行
git clone https://github.com/Stonewuu/ai-fusion-video.git克隆仓库。快速启动:Docker用户直接运行
docker compose up -d,源码开发者先启动中间件docker compose -f docker-compose-middleware.yml up -d,再分别启动后端./mvnw spring-boot:run和前端pnpm dev。系统配置:访问
http://localhost:8080(Docker)或http://localhost:3000(开发模式),在系统设置页配置AI模型密钥与存储后端。创作流程:创建项目→编写剧本→AI生成分镜→AI绘制参考图→AI生成视频片段→素材导出。
融光的关键信息和使用要求
开源协议:MIT License,可自由商用与二次开发。
硬件要求:需支持Docker的运行环境或本地JDK 21+运行环境,建议配备充足内存用于AI模型调用。
依赖服务:必须配置MySQL数据库与Redis缓存,可选配置对象存储服务。
API密钥:使用AI功能需自行准备OpenAI、Claude等服务商的API密钥。
部署方式:支持Docker Compose一键部署与源码本地开发两种模式。
融光的核心优势
全流程自动化:覆盖剧本到成片的完整工作流,减少人工干预环节。
多模型兼容:不绑定单一AI服务商,支持主流大模型灵活切换与对比。
开源可定制:MIT协议开源,支持私有化部署与深度功能扩展。
可视化Agent流程:Pipeline节点可视化展示,创作过程透明可控。
分镜驱动生成:以分镜为中间层,确保视频内容与剧本意图保持一致。
融光的项目地址
- GitHub仓库:https://github.com/Stonewuu/ai-fusion-video
融光的同类竞品对比
| 对比维度 | 融光 (AI Fusion Video) | HeyGen | Runway Gen-3 |
|---|---|---|---|
| 产品定位 | 开源Agent驱动全流程创作平台 | 云端AI数字人视频生成工具 | 专业AI视频编辑与生成平台 |
| 工作流模式 | 剧本→分镜→图像→视频的多阶段Pipeline | 模板选择→数字人驱动→视频合成 | 素材上传→AI生成→多轨道后期编辑 |
| 可控性 | 高(分镜级精细控制,支持迭代调整) | 中(依赖预设模板与数字人形象) | 中高(运动笔刷、绿幕、相机控制等专业工具) |
| 开源程度 | 完全开源(MIT协议,可私有化部署) | 闭源SaaS服务 | 闭源SaaS服务 |
| 模型支持 | 多厂商兼容(OpenAI/Claude/Gemini/国产模型等) | 自研模型为主 | 自研Gen-3系列模型为主 |
| 适用场景 | 专业创作者全流程管理、团队协作 | 营销视频快速生成、数字人播报 | 影视级广告制作、视觉特效、艺术短片 |
融光的应用场景
短视频创作:快速将文案脚本转化为带画面的短视频内容,适合自媒体批量生产。
广告营销:根据产品描述自动生成多版本广告分镜与视频素材,加速创意迭代。
教育培训:将教学大纲自动拆解为可视化课程片段,降低教育视频制作门槛。
影视预演:独立制片人利用AI快速生成故事板与动态预演,验证拍摄方案可行性。
动画原型:动画创作者通过AI分镜快速验证叙事节奏与视觉风格。
