一个月蹦出4个国产Sora：“拍个手”集体阵亡

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

12381点击 2024-08-04 14:10

家人们，咱就说这个国产Sora啊，就在七月这一个月时间里，那“增速”简直就是霸屏模式——

可灵、PixVerse V2、清影、Vidu……

面对眼前一水儿的AI视频生成软件，相信大家也和我一样：

感慨过后，一个想法立即浮上心头：

能不能把它们拉到一起，搞个横评，看看谁家的国产Sora更胜一筹？

说干就干，我们先来简单介绍一下此次参赛的几位选手：

①号选手：可灵，快手AI团队出品，7月6日网页端正式上线。
②号选手：PixVerse V2，由爱诗科技于7月24日正式发布。
③号选手：清影，由智谱AI打造，7月26日在网页、APP和小程序端上线。
④号选手：Vidu，清华系初创生数科技在7月30日发布。

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

我们这次的battle将围绕图生视频和文生视频两个大赛道展开，其中还会包含风景、动物、人物甚至梗图等多项生成能力测试。

对于各个选手来说，不仅要考验的是它们最终生成的质量，更关键的是画面一致性、是否符合给定prompt等更为细节的内容。

接下来，量子位一手实测这就奉上。

Round 1：图生视频

这第一关，咱就先来试试诸位选手的“图生视频”能力。

老规矩，开局只给一张图和一段prompt，不进行任何其他操作，以保证原汁原味儿~

经典梗图

提到梗，那就不得不搬出《甄嬛传》了~

我们先给每位选手“喂”下面这张图：

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

然后简单的给一句prompt：

甄嬛慢慢戴上了墨镜。

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

首先从戴墨镜这个细节来看，只有可灵算是把墨镜这个实体完完整整地给生成出来了。

而清影和Vidu生成的墨镜还是透明的，并非我们印象中的那种墨镜。

至于PixVerse V2……则直接生成了个寂寞。

其次，从自然度来看，可灵的甄嬛低头戴墨镜也是比较符合生活中的逻辑，属于最自然的那个。

而在清影和Vidu里，甄嬛佩戴墨镜的位置略显高了一些；以及，清影生成的手指出现了6个。

因此在梗图的较量中，可灵明显胜出！

脑洞大开的科幻大片

接下来，我们来测试一下AI们的想象力如何。

操作同样是先“喂”一张末日场景图：

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

这次的prompt涉及的“剧情”会稍微复杂一点，例如：

最后一艘人类飞船逃离，透过舷窗，一只彩虹色的气球慢镜头飘过。

我们来看下四位选手的生成效果：

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

这次battle的结果就比较明显了。

最符合prompt的便是PixVerse V2，不仅模式爆炸场景还在延续，也有一个彩虹气球飘过。

其次是可灵，但气球出现的较为突然和诡异，并且颜色只是单一的紫色。

清影方面则是莫名其妙的出现了一个彩虹团，并没有生成气球的样子。

但最惨的还是Vidu，直接什么都没有，但隐约似乎是把远处爆炸的云朵里带了点彩虹的颜色。

此局，PixVerse V2，Win！

老照片动起来

最后一个图生视频的测试，我们玩儿复活老照片：

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

prompt是这样的：

小朋友边转过身来边拍手。

我们来看下效果：

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

嗯，集体阵亡。

不拍手的不拍手，拍手的手基本上全鬼畜。

但相比来看，Vidu的效果会稍微强一些，不仅完成了关键“拍手”动作（虽然有几帧还是出错了），还自带降雨效果，活脱脱一场“儿童雨中嬉戏”~

看来AI处理手还是非常困难的。

本轮，Vidu的表现相对出众一些！

至此，先来一个小总结：

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

Round 2：文生视频

在图生视频之后，我们进入下一个大赛道——文生视频。

同样的，在这个环节中我们还设置了多个细分项目，从多个不同维度来测试各个AI选手的实力。

Sora同款prompt

首先就是跟文生视频“鼻祖”Sora，用官网呈现的同款prompt来对比看下效果。

例如最为经典的“Sora女郎”：

A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

所有的效果均不如Sora那般逼真，但可以说是各有风格特色。

例如可灵和Vidu的人物在走路姿态上更自然一些；PixVerse V2的人物在面部的一致性上较好；而清影则是整体画面的色彩更为丰富。

一镜到底

接下来，为了测试AI选手们生成画面一致性的能力，我们来一段一镜到底的复杂prompt：

生成一段主题为《城市公园的早晨》视频。请使用一镜到底的拍摄技巧，从公园入口开始，缓慢推进镜头，捕捉清晨阳光下公园的景象。镜头应平稳移动，依次展现以下元素：

1、公园入口的标识牌，阳光透过树叶间隙，形成斑驳的光影。

2、晨跑的人群，他们脸上洋溢着活力和朝气。

3、儿童游乐区，孩子们在秋千和滑梯上玩耍，笑声充满整个场景。

4、最后，镜头回到公园的另一侧出口，结束视频。

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

从结果来看，所有选手在大场景的表现均不错，可以把公园、树木生成的栩栩如生。

But！

所有选手在人物上全部出现错误：畸变的、消失的、魔幻的……

大特写

在一致性之后，我们继续测试一下特写镜头，AI们是否能够hold住：

动画场景，展示一个粉色的毛绒绒的小怪物抱着一块很大的芝士在吃，3d风格，需要注重画面的细节，小怪物的神情充满喜悦，表现出顽皮天真的样子。温暖的颜色和氛围的灯光。

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

这一轮的测试，除了PixVerse V2出现的畸变之外，其它三位选手不论是一致性还是画面丰富度，均表现出众。

多主体

最后，我们试一下选手们能否在一个视频里一口气hold住多个主体，例如：

冬天，一家三口，爸爸，妈妈，还有女儿坐在沙发上，旁边有只猫咪趴着睡觉，火炉取暖，温馨画面。

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

在画风方面，只有可灵将“温馨”解读成了黑白风格，其它三位选手的画风均比较契合prompt。

Vidu还是唯一一个生成了中国家庭的那个。

但所有玩家都没能完整生成prompt中的4个主体，即三个人类和一只猫，都或多或少的出现了缺失的情况。

同样的，到这里我们再来一个小总结：

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

以上就是这次AI视频生成的全部评测内容了。

那么接下来的一个问题是：

国产AI生成视频，哪家强？

除了上述效果之外，我们先再来看另一个维度的较量——生成速度：

我们针对图生视频和文生视频两个大赛道，分别对每个选手、每个案例统计了生成时间：

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

令人比较意外的，新秀Vidu不论是在哪个赛道，都只需要1分钟不到的时间，是唯一一个进到“秒生成俱乐部”的玩家。

剩下的三位，整体来看，清影的生成速度高于其他二位。而且需要说明的一点是，清影的视频时长为6秒，其他两位是5秒。

至于可灵和PixVerse V2，整体而言PixVerse V2更快。

小结一下，整体生成速度排列如下：

Vidu > 清影 > PixVerse V2 > 可灵

不过在功能方面，还有一些细节内容值得说道说道。

例如PixVerse V2是支持免费把视频长度扩展到8s；可灵是可以扩展到10s，但不支持高性能模式；清影和Vidu则是固定时长。

在生成数量限制方面，清影是相当的霸气，完全不限次！

而其它三位玩家均采用积分制：

可灵：每日登录免费获66灵感值，生成单次5秒视频需消耗10灵感值
PixVerse V2：注册即获得100 Credits，每天还能免费得50 Credits，单次5秒视频需消耗15 Credits
Vidu：注册即获得80积分，更多积分需订阅

……

最后，从视频的生成效果、生成速度和功能等全方面来看，目前并不能判定哪家国产Sora属于最强，只能说是各有千秋。

文章来源于“量子位”，作者“ 关注前沿科技”

一个月蹦出4个国产Sora：“拍个手”集体阵亡 | 全方位评测

关键词: sora , AI , AI视频 , 可灵 , PixVerse V2 , 清影 , Vidu

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0