两天前, 国内 AI 独角兽 MiniMax 重磅发布的视频生成模型video-01,因其能够生成超逼真的人类视频,特别是在手部动作的精准模拟方面表现卓越,迅速引起了业界的广泛关注。这款 AI 工具的问世标志着生成式 AI 领域的又一次重要突破。但它到底表现如何呢?
MiniMax 的开发公司是一家由阿里巴巴和腾讯支持的独角兽初创企业。此前,这家公司已经在 AI 领域取得了不小的成绩,其 AI 伴侣应用 Talkie 已经被下载超过 1500 万次,用户可以通过该应用与虚拟角色进行互动,类似于 Character.ai 。官方在 X 平台上发布的一段演示视频展示了一部魔幻冒险片的预告片,讲述了一个孩子触摸一枚硬币后穿越历史的故事。这段视频完全由文本提示、AI 技术和巧妙的编辑生成,包含了特效、角色一致性和高度逼真的效果,令观众惊叹不已。
针对于最新的模型,网络上也出现了一些实际测试效果。
提示词:”一个夜晚的场景,高耸的未来城市天际线,建筑光滑且发光。突然,明亮的闪电划过天空,照亮建筑物并投射出戏剧性的阴影。雨开始倾盆而下,场景以雨滴击打霓虹灯街道的特写结束。”
提示词:”一个宁静的近景,平静的池塘中央有一朵盛开的睡莲。一只精致的蝴蝶从旁边飞来,轻轻落在花上。随着蝴蝶的翅膀缓慢地合拢和展开,水中的涟漪微微移动,营造出宁静的氛围。”
提示词:”一个广阔的外星地貌,天空中有两个月亮。前景中,一艘带有未来设计元素的光滑飞船开始启动,发动机发光。随着飞船起飞,地面轻微颤动,留下尘土和发光的余烬,迅速升空。”
提示词:”非洲大草原的黄昏,一个威严的场景。狮群聚集在一个水塘附近,前景中有一只雄狮。狮子的金色毛皮在逐渐暗淡的阳光下闪耀,他们一边喝水,一边巡视着四周。场景以雄狮抬头凝视远方、天空变成深橙色结束。”
提示词:”一个棕褐色调的老式影院标题卡,带有华丽的边框和经典字体。中央出现‘呈现:失落宝藏的冒险’字样,伴随着细微的胶片颗粒效果和旧电影胶卷的闪烁。标题停留片刻后淡出,只留下颗粒状的背景。”
提示词:”一个温馨的复古风格餐厅,灯光温暖柔和,设有红色皮革座椅和角落里的经典点唱机。前景中,一个二十多岁的年轻女子坐在座位上,随意地聊天并微笑。她有着齐肩的棕色头发,穿着浅蓝色毛衣和牛仔裤。她神态活泼,用手势表达她的热情和参与感。”
提示词:”一个令人惊叹的北极之夜,天空中出现了绚丽的北极光表演。绿色、紫色和蓝色的极光在天空中跳跃,形成令人着迷的节奏。背景中是雪山,其山顶被极光的光辉照亮。”
测试结果显示,MiniMax 的表现确实令人印象深刻,其生成效果可以媲美 Runway Gen-3、Dream Machine 和 Kling 等顶级 AI 视频生成器。不过,尽管效果优秀,但与官方宣传视频中展示的效果相比,仍然存在一定差距。
MiniMax 视频-01 是该公司推出的一系列生成模型中的最新款,包括此前发布的语音、语言和音乐生成模型。该视频生成模型于九月初低调发布,但很快在中国和西方的社交媒体上引发了热议。公司创始人闫俊杰在接受采访时表示:“我们在视频模型生成方面确实取得了重大进展。根据内部评估和评分,我们的表现已经超过了 Runway 在生成视频方面的效果。”
据悉,该公司已经开始研发 MiniMax 的 02 版视频模型,并计划在未来的更新中加入图像到视频、文本和图像到视频以及更长剪辑的生成功能。目前,MiniMax 视频-01 支持 1280×720 分辨率的视频生成,帧率为 25 帧每秒。与 Kling 和 Runway 类似,用户可以通过文本描述电影般的镜头运动。目前,MiniMax 生成的视频长度为六秒,但公司计划在下一次更新中将其延长至 10 秒,以追赶当前行业的领先水平。
尽管 MiniMax 视频-01 的表现已相当优秀,但在与 Luma Labs 的 Dream Machine 和 Runway Gen-3 的比较中仍稍显逊色。另一方面,另一款在西方市场上广泛使用的中国视频生成模型 Kling(可灵),无论在生成质量还是功能集的丰富性上,都显著领先于 MiniMax。不过,MiniMax 在生成人类动作方面表现出色,并且其开发团队承诺后续版本将在几周内发布。
文章来源“TodayAI”,作者“TodayAI”