HTML版剪映来了！Open Design 团队最新开源力作，3天时间，写了3万行代码！

8063点击 2026-06-10 10:03

视频制作行业正在经历一场革命。

过去，要做出一支像样的产品宣传视频或者知识解说视频，你需要专业的剪辑师、动画师、配音员，可能还要花几万块钱找外包团队。

即使是小团队自己做，也得精通AE、Pr这些复杂的工具，光学习成本就高得吓人。

而且，这一切成本和门槛都还是建立在人工操作的基础上的。

就在这个时候，Open Design 团队干了一件大事。他们用了3天时间，写了3万行代码，把视频制作这件事彻底改写了，而且照样是开源的。

HTML版剪映来了！Open Design 团队最新开源力作，3天时间，写了3万行代码！

现在，你只需跟你的 AI Agent 说句话，或者粘贴一个公众号文章链接，它就能直接给你生成一支动态的 MP4 视频。而且，这个过程完全在你本机上运行，没有云端渲染费用，也不绑定任何厂商。

这就是 html-video —— 一个把HTML变成视频的革命性工具。

HTML版剪映来了！Open Design 团队最新开源力作，3天时间，写了3万行代码！

什么是html-video？

html-video 是 Open Design 团队官方研发的开源项目，它的核心理念很简单：在你的电脑上，把 HTML 变成视频。

你不需要是专业的剪辑师，也不需要是动画专家。你只需要：

描述一个视频（或者直接粘贴一个文章链接/GitHub仓库）
让你的 Agent 来处理
导出真实的 MP4 视频

这个过程中，Agent会自动帮你：

选择合适的渲染引擎
挑选最匹配的视频模板
填入你的内容
渲染出高质量的视频

而且，所有这些都在你的本地机器上完成，不用上传到任何云端，也没有单次渲染费用。

核心亮点：为什么html-video不一样？

1、基于Hyperframes框架

html-video 不是从零开始的。它的默认渲染引擎是 Hyperframes，这是一个成熟的 HTML+CSS+GSAP 框架，专门用来做动态HTML动画。

而整个项目的架构思想，其实和 Open Design 在设计领域的产品是一脉相承的。

而且，这个架构是可插拔的。现在默认用的是Hyperframes，未来Remotion、Motion Canvas、Manim这些引擎都会一一接进来。加一个新引擎，所有模板、所有agent、整条工作流就都自动用上了。

2、21套顶级HTML视频模板

html-video 内置了21个精选、许可清晰的视频模板，每一个都是经过精心设计的。

HTML版剪映来了！Open Design 团队最新开源力作，3天时间，写了3万行代码！

这些模板不是随手凑的一堆，而是覆盖了各种常见的使用场景：

数据可视化：纽约时报风格的动态折线图、瑞士网格数据卡，适合「数字涨上去了」类叙事
标题与特效：故障艺术标题、动感排版、打字机光标，适合开场爆点
主视觉与电影感：极光液态渐变背景、漏光电影感画面、暖色颗粒杂志风
产品宣传：15秒/30秒多场景产品宣传片
解说骨架：决策树解说、Takram有机动效

每个模板都有清晰的分类和标签，agent 可以根据你的意图自动匹配最合适的模板。

更重要的是，这些模板都可以在 Open Design 中找到，保持了设计系统的一致性。

3、分页预览、分页编辑、帧文字编辑

传统的视频制作工具，你改一点东西就得重新渲染整个视频，等上半天才能看到效果。html-video 完全改变了这个工作流。

它支持：

分页预览：每一帧都可以单独预览，不用等整个视频渲染完
分页编辑：每一帧都可以单独编辑，想改哪帧改哪帧
帧文字编辑：直接在界面上修改每帧的文案，所见即所得

而且，它支持多种视频尺寸：

横屏 16:9
竖屏 9:16
方形 1:1
小🍠 4:5

你可以根据发布平台随时切换尺寸，不用重新制作。

4、自动识别本地6种Code Agent

html-video 最厉害的一点是，它可以自动识别你电脑上已经安装的 coding agent。目前支持14个主流的 agent：

Open Design (Vela)
Windsurf CLI
Trae CLI
Claude Code
Cursor Agent
Codex CLI
Hermes
Gemini CLI
Grok Build
Qwen Code
OpenCode
GitHub Copilot CLI
Aider
Anthropic Messages API

这些 agent 会在你的 PATH 上自动探测，你只需要在 studio 的顶栏一键切换就可以了。没有本地 agent 也没关系，你可以直接使用官方 AMR 接入，或者配置 Anthropic API key，studio 直接走 Messages API。

而且，studio 默认把 Open Design (Vela) 排在最前面——一次登录、多种模型、成本更低——然后回落到第一个可用的 agent，保证你永远有一个能用的后端。

5、已接入MiniMax

视频没有声音是不完整的。html-video 已经接入了 MiniMax，你可以一键给视频加上背景音乐和旁白。

在 Settings → Audio 里填入 MiniMax API key，然后在每个项目的 Soundtrack 面板：

背景音乐：描述一种情绪（比如「舒缓的电影感氛围，缓慢推进」），MiniMax 会生成一段器乐
旁白：输入文案，MiniMax 会朗读出来（TTS）

两者都会通过 ffmpeg 混进导出的 MP4，音乐还会自动压低到人声之下，还支持可选的淡入淡出效果。

快速上手

在开始之前，你需要先安装几个依赖：

HTML版剪映来了！Open Design 团队最新开源力作，3天时间，写了3万行代码！

默认渲染引擎用无头 Chromium 录制带动画的 HTML，再用 ffmpeg（libx264）编码为 MP4。如果没有系统安装的 Chromium，可以装 Playwright 内置的。

安装和运行都很简单：

pnpm install

pnpm -r build

node packages/cli/dist/bin.js studio # 在 http://127.0.0.1:3071 打开 studio

然后在浏览器里打开 http://127.0.0.1:3071，你就可以看到 html-video 的 studio 界面了。

在 studio 里，你可以：

挑一个模板（或者直接描述视频/粘链接）
跟 agent 对话
逐帧改文案
加配乐
导出 MP4

就这么简单。

支持三种输入方式：

网页文章：抓取并扁平成 Markdown。像微信公众号这种服务端渲染的页面开箱即用。
GitHub 仓库：通过公开 API 拉取简介、顶层结构、README——很适合做「解读某开源项目」的视频。
只给一句话：描述主题，agent 从零写内容。

无论哪种来源，它都会成为视频真正依据的素材——不是套模板时的摆设。

agent 会读取抓来的内容，自己决定需要几个场景，写出一份 content-graph 故事板：要点变成帧，要点之间的关系（这个承接那个、这个对比那个）变成边，再把所选模板的视觉风格逐帧应用上去。

CLI工具

除了图形化的 studio，html-video 还提供了可脚本化的 CLI 工具：

node packages/cli/dist/bin.js doctor # 探测已安装的 agent + 引擎

node packages/cli/dist/bin.js search-templates --intent "github stars race" --top 3

这对于想把 html-video 集成到自己 CI/CD 流程中的团队来说非常有用。你可以写个脚本，每天自动生成项目进度视频，或者自动把新发的博客文章转成视频。

写在最后

html-video 给我们展示了一种全新的视频制作方式。它不是要取代专业的剪辑师，而是要让每一个人都能轻松地制作出高质量的视频。

而且，这一切的成本都极低——你只需要一台电脑，不需要任何专业设备，也不需要给任何云端服务付费。

Open Design 团队用了3天时间写了3万行代码，给我们带来了这样一个革命性的工具。这就是开源的力量——一群聪明人聚在一起，就能改变世界。

如果你对这个项目感兴趣，不妨去 GitHub 上看看，给它一个 Star，或者直接上手试试。

GitHub地址：https://github.com/nexu-io/html-video

文章来自于"开源星探"，作者 "开源星探"。

关键词: AI新闻 , AI剪辑 , AI视频 , html-video

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales