Manus疯狂更新,视频生成也来了!
△源自𝕏:Manus官方账号
和大多数视频生成AI不同,Manus这次可以通过连续拼接突破视频时长限制。
举个栗子,虽然Manus“自述”目前只能通过文本/参考图像生成5s视频,但面对用户提出的15s视频请求,它能根据主题单独生成3个5s视频,并最终自动合成一个完整故事。
△源自𝕏:@いしたにまさき
按照官方的说法,仅需一个提示:
Manus就能规划每个场景、制作视觉效果,并将您的愿景生动地呈现。
在这种颇具“智能体style”的全新视频生成方式中,视频生成开始与Manus平台的其他功能组合发挥作用。
比如根据上图中的提示词,生成《山海经》中的神话形象,并且还需要创建一个类似TikTok的短视频平台来展示。
最终效果be like:
对于Manus的这次上新,有网友激动表示:这开启了Manus的新纪元!
不过目前该功能仅限Manus会员使用,普通用户还要再等等。
与此同时,第一波氪金选手的测试也新鲜出炉了。
分享更多例子之前,我们先来康康Manus生成视频需要经历几个步骤。
比如最终结果是下面这个视频:
△源自𝕏:@いしたにまさき
制作一部日式风格的电影视频,来庆祝Manus的视频生成能力。
通过开头提到的思考过程,Manus一共采取了以下行动:
一般而言,当前大多数视频生成AI只能看到“输入—输出”,用户无法感知其具体过程,并且视频时长通常较为固定,用户一旦想要延长视频,还得另寻其他第三方剪辑软件。
而Manus展示了智能体时代下,AI生成视频的另一种新形态。
它目前呈现出了一种类似“拍电影”的视频生成方式,Agent能自动根据提示词单独生成每个片段,最终合成完整故事。
这也和绝大多数网友的反馈一致,只不过生成效果方面还有提升空间。
一句话总结网友的感受就是:
这是一种新的视频创作方式,但整体效果并未从当前一众产品中脱颖而出。
不过嘛,单拉出网友的例子来看,目前的生成效果也和“抽卡”一样,有好有坏。
在一位小哥的测试中,他认为Manus生成的玄幻大片比Sora更好。
△源自𝕏:@Dmitri Lihhatsov
而且有一位日本网友反馈,视频生成类任务的积分消耗没有想象中大。
他要求Manus生成了一个5s的美人鱼变身视频,只不过没有透露具体积分情况。
△源自𝕏:@かきもち
但是从另一位网友的测试中,我们能大概推算出5s视频约需要166左右积分。(具体以实际为准)
这位小哥联动Manus和之前出圈的设计AI Lovart,用时10分钟生成了一段30s视频,消耗1000左右积分 。
提示词(中译):成人的休闲时光,一位女士驾驶着豪华轿车在崎岖不平的道路上前往一家甜甜圈店,这是‘Lovart’的促销活动。
△源自𝕏:@ぽんず
当然,视频中的关键画面均由Lovart生成,Manus此处更多承担着衔接作用。
也有集大成者,直接用Manus一口气生成了15个带单镜头提示的场景。
△源自𝕏:@こはく
这位小哥激动表示,最重要的是Manus支持编辑了,这意味着:
如果你精通编辑,就能真正做到仅使用自然语言就能批量制作视频。
不过,据其他网友吐槽,Manus生成完整故事情节的能力并不稳定,目前看来还是“噱头大于实际能力”。
那种AI味儿很浓的视频也不在少数,以至于网友开始怀疑自己是否用对了提示词。
△源自𝕏:@マスクさん
笑死,有五毛钱特效内味儿了(doge)。
但不可否认的是,Manus单独可拆分的做法意味着今后视频优化更方便了。
怎么理解?
大神卡帕西对此曾有详细解释,他认为如今视频制作的门槛正在趋近于0。
在他看来,视频是大脑接收的最高带宽输入方式,不仅用于娱乐,还广泛应用于工作和学习(如图表、动画等)。
同时视频是最轻松和有趣的媒介,大多数人更愿意观看视频,而不是费力地阅读或写作。
更重要的是,新技术的出现让制作视频的门槛大幅降低,理论上可以无限生成视频并直接优化。
传统视频平台依赖于人类创作者和算法来优化内容推荐,但这种方式效率较低。
新的视频生成技术(如Veo 3)通过神经网络直接生成视频,这是一个可微分的过程,可以通过梯度下降法直接优化视频内容。
而Manus,刚好也是新技术的采用者之一。按照𝕏知名博主的说法:
神经网络可以实时生成用户理想的视频,它根据用户的注意力进行训练。
最后不得不感叹,Manus自开放注册以来真是动作频频。
5月13日,它面向所有用户免费开放注册,新用户开局可得1000积分+每日300积分。
仅过了3天,又上新了图像生成功能,号称告别一般AI绘图工具的“抽卡”模式,Manus能够理解你画图的目的,规划出生成方案后再“动手”。
之后陆陆续续上线了Manus团队版、网站文本编辑等功能,并官宣了与微软的合作。
再到最近两天,它还推出了PPT制作功能,收获了一大波打工人的好评。
可以看到,随着越来越多玩家涌入智能体赛道,Manus已经按下加速键试图一直吸引众人眼球。
不过对普通用户来说,这一次咋又是期货?此处随机艾特一位嘴替:
参考链接:
[1]https://x.com/ManusAI_HQ/status/1929913745503072551
[2]https://x.com/karpathy/status/1929634696474120576
[3]https://x.com/rohanpaul_ai/status/1929925654968954954
[4]https://x.com/dimileeh/status/1930029170391736741
文章来自于“量子位”,作者“一水”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0