HTML版剪映来了!Open Design 团队最新开源力作,3天时间,写了3万行代码!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
HTML版剪映来了!Open Design 团队最新开源力作,3天时间,写了3万行代码!
8063点击    2026-06-10 10:03

视频制作行业正在经历一场革命。


过去,要做出一支像样的产品宣传视频或者知识解说视频,你需要专业的剪辑师、动画师、配音员,可能还要花几万块钱找外包团队。


即使是小团队自己做,也得精通AE、Pr这些复杂的工具,光学习成本就高得吓人。


而且,这一切成本和门槛都还是建立在人工操作的基础上的。


就在这个时候,Open Design 团队干了一件大事。他们用了3天时间,写了3万行代码,把视频制作这件事彻底改写了,而且照样是开源的。


HTML版剪映来了!Open Design 团队最新开源力作,3天时间,写了3万行代码!


现在,你只需跟你的 AI Agent 说句话,或者粘贴一个公众号文章链接,它就能直接给你生成一支动态的 MP4 视频。而且,这个过程完全在你本机上运行,没有云端渲染费用,也不绑定任何厂商。


这就是 html-video —— 一个把HTML变成视频的革命性工具。


HTML版剪映来了!Open Design 团队最新开源力作,3天时间,写了3万行代码!


什么是html-video?


html-video 是 Open Design 团队官方研发的开源项目,它的核心理念很简单:在你的电脑上,把 HTML 变成视频


你不需要是专业的剪辑师,也不需要是动画专家。你只需要:


  1. 描述一个视频(或者直接粘贴一个文章链接/GitHub仓库)
  2. 让你的 Agent 来处理
  3. 导出真实的 MP4 视频


这个过程中,Agent会自动帮你:


  • 选择合适的渲染引擎
  • 挑选最匹配的视频模板
  • 填入你的内容
  • 渲染出高质量的视频


而且,所有这些都在你的本地机器上完成,不用上传到任何云端,也没有单次渲染费用。


核心亮点:为什么html-video不一样?


1、基于Hyperframes框架


html-video 不是从零开始的。它的默认渲染引擎是 Hyperframes,这是一个成熟的 HTML+CSS+GSAP 框架,专门用来做动态HTML动画。


而整个项目的架构思想,其实和 Open Design 在设计领域的产品是一脉相承的。


而且,这个架构是可插拔的。现在默认用的是Hyperframes,未来Remotion、Motion Canvas、Manim这些引擎都会一一接进来。加一个新引擎,所有模板、所有agent、整条工作流就都自动用上了。


2、21套顶级HTML视频模板


html-video 内置了21个精选、许可清晰的视频模板,每一个都是经过精心设计的。


HTML版剪映来了!Open Design 团队最新开源力作,3天时间,写了3万行代码!


这些模板不是随手凑的一堆,而是覆盖了各种常见的使用场景:


  • 数据可视化:纽约时报风格的动态折线图、瑞士网格数据卡,适合「数字涨上去了」类叙事
  • 标题与特效:故障艺术标题、动感排版、打字机光标,适合开场爆点
  • 主视觉与电影感:极光液态渐变背景、漏光电影感画面、暖色颗粒杂志风
  • 产品宣传:15秒/30秒多场景产品宣传片
  • 解说骨架:决策树解说、Takram有机动效


每个模板都有清晰的分类和标签,agent 可以根据你的意图自动匹配最合适的模板。


更重要的是,这些模板都可以在 Open Design 中找到,保持了设计系统的一致性。


3、分页预览、分页编辑、帧文字编辑


传统的视频制作工具,你改一点东西就得重新渲染整个视频,等上半天才能看到效果。html-video 完全改变了这个工作流。


它支持:


  • 分页预览:每一帧都可以单独预览,不用等整个视频渲染完
  • 分页编辑:每一帧都可以单独编辑,想改哪帧改哪帧
  • 帧文字编辑:直接在界面上修改每帧的文案,所见即所得


而且,它支持多种视频尺寸:


  • 横屏 16:9
  • 竖屏 9:16
  • 方形 1:1
  • 小🍠 4:5


你可以根据发布平台随时切换尺寸,不用重新制作。


4、自动识别本地6种Code Agent


html-video 最厉害的一点是,它可以自动识别你电脑上已经安装的 coding agent。目前支持14个主流的 agent:


  • Open Design (Vela)
  • Windsurf CLI
  • Trae CLI
  • Claude Code
  • Cursor Agent
  • Codex CLI
  • Hermes
  • Gemini CLI
  • Grok Build
  • Qwen Code
  • OpenCode
  • GitHub Copilot CLI
  • Aider
  • Anthropic Messages API


这些 agent 会在你的 PATH 上自动探测,你只需要在 studio 的顶栏一键切换就可以了。没有本地 agent 也没关系,你可以直接使用官方 AMR 接入,或者配置 Anthropic API key,studio 直接走 Messages API。


而且,studio 默认把 Open Design (Vela) 排在最前面——一次登录、多种模型、成本更低——然后回落到第一个可用的 agent,保证你永远有一个能用的后端。


5、已接入MiniMax


视频没有声音是不完整的。html-video 已经接入了 MiniMax,你可以一键给视频加上背景音乐和旁白。


在 Settings → Audio 里填入 MiniMax API key,然后在每个项目的 Soundtrack 面板:


  • 背景音乐:描述一种情绪(比如「舒缓的电影感氛围,缓慢推进」),MiniMax 会生成一段器乐
  • 旁白:输入文案,MiniMax 会朗读出来(TTS)


两者都会通过 ffmpeg 混进导出的 MP4,音乐还会自动压低到人声之下,还支持可选的淡入淡出效果。


快速上手


在开始之前,你需要先安装几个依赖:


HTML版剪映来了!Open Design 团队最新开源力作,3天时间,写了3万行代码!


默认渲染引擎用无头 Chromium 录制带动画的 HTML,再用 ffmpeg(libx264)编码为 MP4。如果没有系统安装的 Chromium,可以装 Playwright 内置的。


安装和运行都很简单:


pnpm install

pnpm -r build

node packages/cli/dist/bin.js studio # 在 http://127.0.0.1:3071 打开 studio


然后在浏览器里打开 http://127.0.0.1:3071,你就可以看到 html-video 的 studio 界面了。


在 studio 里,你可以:


  1. 挑一个模板(或者直接描述视频/粘链接)
  2. 跟 agent 对话
  3. 逐帧改文案
  4. 加配乐
  5. 导出 MP4


就这么简单。


支持三种输入方式:


  • 网页文章:抓取并扁平成 Markdown。像微信公众号这种服务端渲染的页面开箱即用。
  • GitHub 仓库:通过公开 API 拉取简介、顶层结构、README——很适合做「解读某开源项目」的视频。
  • 只给一句话:描述主题,agent 从零写内容。


无论哪种来源,它都会成为视频真正依据的素材——不是套模板时的摆设。


agent 会读取抓来的内容,自己决定需要几个场景,写出一份 content-graph 故事板:要点变成帧,要点之间的关系(这个承接那个、这个对比那个)变成边,再把所选模板的视觉风格逐帧应用上去。


CLI工具


除了图形化的 studio,html-video 还提供了可脚本化的 CLI 工具:


node packages/cli/dist/bin.js doctor # 探测已安装的 agent + 引擎

node packages/cli/dist/bin.js search-templates --intent "github stars race" --top 3


这对于想把 html-video 集成到自己 CI/CD 流程中的团队来说非常有用。你可以写个脚本,每天自动生成项目进度视频,或者自动把新发的博客文章转成视频。


写在最后


html-video 给我们展示了一种全新的视频制作方式。它不是要取代专业的剪辑师,而是要让每一个人都能轻松地制作出高质量的视频。


而且,这一切的成本都极低——你只需要一台电脑,不需要任何专业设备,也不需要给任何云端服务付费。


Open Design 团队用了3天时间写了3万行代码,给我们带来了这样一个革命性的工具。这就是开源的力量——一群聪明人聚在一起,就能改变世界。


如果你对这个项目感兴趣,不妨去 GitHub 上看看,给它一个 Star,或者直接上手试试。


GitHub地址:https://github.com/nexu-io/html-video


文章来自于"开源星探",作者 "开源星探"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales