一夜收获3000颗星,OpenMontage是AI视频的“龙虾时刻”吗?

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一夜收获3000颗星,OpenMontage是AI视频的“龙虾时刻”吗?
8244点击    2026-06-29 18:13

我敢打赌,AI视频生成这个行业,要因为这一个免费开源的项目而变天了。


没错,我说的就是从6月下半旬开始在Github上爆火的OpenMontage。


这是一个专门用来给AI视频生成准备的Harness工具,你把你的提示词给它,它就能自动帮你完善成专业的AI视频生成提示词,并且还配有剪辑、配音等等一系列后期工作。


并且它跟OpenClaw一样,会自动帮你挑视频模型,在满足你需求的前提下,它会想方设法地去降低整个工作流的成本。


具体有多神呢?下面这段视频就是完全用OpenMontage生成的,标题为“来自明天的信号 (SIGNAL FROM TOMORROW)”。


一夜收获3000颗星,OpenMontage是AI视频的“龙虾时刻”吗?


根据OpenMontage官方的介绍,这是一部完全通过OpenMontage制作的电影级科幻预告片,包括了概念、剧本、场景规划、Veo生成的动态片段、配乐以及Remotion合成。


除了这种概念艺术片之外,OpenMontage还能应用在实际产品宣传上。


比如下面这个视频,通过AI,生成了4张关于一个叫做VOID的脑机接口。OpenMontage会自动为它配上相关的产品介绍,还会把产品的数字概念加以动态演示。


一夜收获3000颗星,OpenMontage是AI视频的“龙虾时刻”吗?


到底是个什么东西?


现在市面上所有的AI视频工具,不管是Sora、Runway、Kling还是Pika,本质上都是片段生成器。你给它一句话,它给你吐出来一段几秒钟的素材。


但是这些工具给你的是“素材”,不是“成片”。


OpenMontage给你的,是一整个视频制作团队的完整视频制作流程。


你跟它说“给我做一个60秒的科普视频,讲清楚黑洞是怎么形成的”,然后它就开始行动了。


• OpenMontage会先上网搜资料,找最新的研究,找观众最关心的问题,确保输出的内容不能是瞎编的


• 然后写脚本,分镜头,算成本,完成这步以后它会问你,如果成本OK分镜OK,那就继续往下执行


• OpenMontage开始生成画面、找素材、配音、找音乐


• 根据生成的画面自动剪辑、加字幕、做转场、混音、调色


• 最后自己先检查一遍,有没有黑帧,声音对不对,字幕准不准,没问题了才把成片给你


整个过程就跟Claude Code一模一样,你是甲方,OpenMontage是乙方全套团队。


OpenMontage的核心是一套状态机驱动的确定性制片系统,每一步干什么、干到什么标准才能往下走,都写死在程序里。


最底层是模型无关适配层。它把14家视频生成API、10个图像模型、4个TTS引擎、本地开源模型(WAN2.1、Hunyuan、CogVideo)、甚至免费公共素材库,全部封装成了统一的接口。


对上层流水线来说,用哪个模型生成的视频其实无所谓,系统会自动根据镜头类型选最合适的模型、算成本。


中间层是52个专业工具。


比如事实核查的网络搜索工具、镜头分析工具(自动抽帧识别景别、转场、节奏点、语音停顿)、基于Remotion和FFmpeg的程序化剪辑引擎等等。


上层是技能工作流。它会规定整个生产过程里,研究阶段要搜多少个来源、脚本要符合什么结构、分镜每个镜头必须包含哪些字段、什么情况要打回重写、什么镜头用什么级别的模型等等。


整个流程跑在一个导演循环(Director Loop)里。


从你输入需求开始,系统自动推进研究→脚本→分镜→资产规划→生成→剪辑→质检,每一步都有明确的验收标准。


说白了,其他AI视频工具是给你一个很厉害的摄像师,你自己还得当导演、当编剧、当剪辑、当制片;而OpenMontage是直接给你拉来了一整个成熟的剧组,你只需要说你想拍什么就行。


而且它跟OpenClaw一样,可以随意更换模型。你有Kling的key就用Kling,有Runway就用Runway。


你可能要问了,那我虽然有token,但我没素材可咋办啊?


没关系,OpenMontage会用免费的图片生成加动画来填充画面,甚至它还能从Archive.org、NASA、Wiki这些免费的地方,去找真实的历史素材、纪录片素材给你剪出来真正的“视频”。


他们官方演示里做了一个60秒的皮克斯风格动画短片,有角色有剧情有配音有字幕,总共才花了1.33美元。还有一个产品广告片,只用了一个OpenAI的key,花了0.69美元。


一夜收获3000颗星,OpenMontage是AI视频的“龙虾时刻”吗?


甚至还可以完全不用花一分钱的,用免费素材加本地配音做出来的纪录片风格视频。


还有一个被所有人忽略的点:它是“参考驱动”的,不是“prompt驱动”的。


这句话的意思是,你不用给OpenMontage说什么“电影感、4K、黄金时刻、景深、85mm镜头”这种话。


你直接把你喜欢的一个短视频或者抖音链接甩给它,说“给我做个跟这个节奏差不多的,但是内容讲量子计算”。


它会自动去分析那个参考视频的节奏、钩子、结构、镜头语言,然后给你出几个方案,告诉你哪些地方保留,哪些地方改了,要花多少钱,做出来大概是什么样。


你不用当prompt工程师,你当甲方就行。


因何而爆火?


OpenMontage的创建者是calesthio,全称为Calesthio AI Labs。calesthio在上传OpenMontage之前,已经开发了许多个开源项目,比如个人情报Agent Crucix(10.3k stars),以及分析工具BreakoutAnalysis、期权交易工具OptionsCanvas、Claude Code 上下文记忆工具SessionAnchor等等 。


其实OpenMontage这个项目早在3月份的时候就在Github上创建了,但直到6月底才开始爆火。


原因在于,早期的OpenMontage只是个框架,提出了这种以Agent形式去生成视频的流程,不过并不能真正帮你执行。


直到6月,calesthio提交了23个commit,还合并了15个社区PR,这才让OpenMontage变成今天的样子。


6月22日到6月26日这几天,OpenMontage几乎每天都要斩获3000多颗星星,其火爆的趋势不亚于3月份的OpenClaw。


OpenMontage能爆火还有一个原因,就是它的README写得非常通俗易懂。


一般的项目,它的README往往都是各种安装依赖、使用说明,OpenMontage不一样,它直接把生成的视频和提示词放进了README开头,是好是坏你一眼便知。


一夜收获3000颗星,AI视频的“龙虾时刻”降临了?


接着它连续放了多个样片案例,并且每个案例都写清楚生产方式和成本。


另外,calesthio还发现中国的AI视频生成市场很大,于是在6月24日,特地用中文重新写了一篇README。其目的不言而喻。


一夜收获3000颗星,AI视频的“龙虾时刻”降临了?


在OpenMontage出现之前,AI视频生成是一件非常麻烦的事情。


首先你得先选平台。用Sora?得有ChatGPT会员,还不一定排得上队,生成10秒视频等半小时,效果还不稳定。用Runway?一分钟视频大几十块钱,生成完了还得自己下载下来。


好不容易生成了几段素材,噩梦才刚刚开始。你得把这几段几秒钟的视频下载下来,打开剪映或者PR,自己拼到一起。然后得自己写文案、自己配音,还得自己找BGM。


虽然此前Seedance 2.0、可灵还有Sora 2都有类似的自动增加配音、自动根据素材生成视频,然而由于各种合规问题和素材质量问题,到头来很多事情还得自己在剪辑时加入。


同一段提示词同一批素材,如果你想换个模型试试,那对不起,所有流程重来一遍。


说白了,之前的AI视频,本质上还是“大公司建游乐场卖门票”。你想进来玩,可以,得按我的规矩来,得买我的票,玩什么项目我说了算,而且有些地方还不让你带零食进来。


OpenMontage不一样,它是免费开源的,一切素材解释权在你。


它把话语权从大公司手里夺回来了。


视频生成行业真要变天了?


很多人可能会问了,不就是一个开源工具吗,至于说的这么邪乎?


可以肯定的一点是,OpenMontage会彻底改变,整个行业的竞争维度,就像我们从Chatbot时代跨越到Agent时代一样。


之前所有人都在卷模型,卷画质,卷时长,卷物理规律对不对。


现在突然有人告诉你,这些都是基础能力,是入场券而已。我是用户,我要的是片子,我要的不是素材,所以你卷那些没用,我要看你们卷的是成片、是分镜。


就像手机行业,前几年大家都在卷处理器,卷摄像头像素,现在处理器够用了,大家开始卷系统,卷影像算法,卷充电速度,卷谁能把用户体验做好。


视频生成这个行业,马上就要进入这个阶段了。


以后再出来一个新模型,说我能生成10秒视频,画质8K,根本没人会惊讶。大家只会在意它能不能接OpenMontage?多少钱一秒?跟其他模型比有什么优势?


还有一个潜在的影响,专业视频制作这个行业,也要开始洗牌了。


很多人说AI替代不了剪辑师,替代不了导演。没错,顶级的导演和剪辑师永远不会被替代,但是90%的中低端视频制作,真的要没了。


当年美图秀秀出来的时候,也有人说替代不了影楼,。当年剪映出来的时候,也有人说替代不了专业剪辑师。


历史永远是这样。新技术出来的时候,一开始大家都觉得玩具一样,然后突然有一天你发现,它已经把你能干的活都干了。


不过也说句实在的。


在体验的过程中,我发现OpenMontage还是有很多bug的,而且很多功能也不完善,做出来的视频也不是每次都能达到专业水准。


但是,开源的力量从来不是一开始就完美,而是它一旦跑起来,就会有全世界的人一起给它添砖加瓦,发展速度会超出所有人的想象。


文章来自于微信公众号 “字母AI”,作者 “字母AI”

AI转型,免费服务,就找AITNT
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales