前几天 MiniMax 发布了海螺视频生成模型 abab-video-1,现场体验非常炸裂。
很多朋友跑来问我,这个海螺视频模型和可灵的区别主要是什么?
于是我做了一个短片,来从六个维度展现这两个视频模型的不同之处。
一句话总结海螺视频就是:美学升级,运镜加分,表情丰富,文字突出。
BTW,可灵已经不免费了,目前售价是58元/月还挺贵的,而海螺视频目前限免体验中,珍惜这种随便吃吃到饱的美好时光吧。
体验地址:https://hailuoai.com/video
众所周知,美学表现非常重要,同样都是SD模型,MJ以超高水准的美学表现赚得盆满钵满。美学是刻在模型骨子里的,光有数据还不够,还要有优质数据才可以。
黄昏时分,一艘幽灵船缓缓驶入被极光笼罩的北极海域, 船身散发出神秘的蓝光。
可灵:从风格看,偏写实一些,像是没有加滤镜的 iPhone 照片,水面的流动表现不足,船的动态和运镜都比较小,突出一个真实。
海螺:风格梦幻,黄昏时分,紫色晚霞,蓝色幽光。极光飞速飘舞,水流灵动,船体飘着蓝色的水雾,属于梦幻世界里才会有的场景。
好的运镜可以让视频画面呈现出动态感和高级感。
跟随镜头,侏罗纪世界的绿色森林, 一只霸王龙飞奔到画面中央,转头看向观众
可灵:镜头微微转向,拍摄位置静态不变,缺少一些灵动。
海螺:镜头随着恐龙的移动变化,让恐龙的头部一直位于画面的中心位置,似乎一直在和恐龙进行互动,让环境也变得更加立体。
观众对人物表情非常敏感,面部表情的变化可以直接带动观众的情绪。
特写镜头:一个间谍在密室里解开密码, 脸上闪过紧张、困惑、恍然大悟和得意的表情。
可灵:表情几乎没有变化,但仔细看能感觉到有一丝微笑
海螺:从眉头紧皱,到舒缓谈话,到开心地笑起来,透过表情看到了角色的内心
多个人物可能具备不同的面部表情,两个角色的表情能够展现人物的关系。这是一个超难的指令。
四个人坐在沙发上,一个人在哭,一个人在笑, 一个人在愤怒,一个人在犯困
可灵:三个人物的表情都是在哭,并未表现多人物的表情,还少了一个人
海螺:四个人物的表情各不相同,基本满足了指令要求,考虑到这个指令的难度,超出预期。在最后几秒中间的两位男性表情复杂了起来
在复杂的环境和动态中考验模型的能力。这个指令包含着复杂的超现实环境、风格化的要求、主要人物、飞行物,也很难。
在一个蒸汽朋克风格的城市里, 一个机械师骑着会飞的自行车穿梭于 高耸的齿轮塔之间,追逐一只会发光的机械鸟。
可灵:城市、机械师、鸟都有,但是画面风格比较灰暗,少了重要的齿轮元素,鸟也没有发光。还是现实感强一些。
海螺:齿轮塔、机械师、发光的鸟,金铜色的画面,风格非常梦幻。
视频中的文字,价值可以参考 Ideogram,MJ 之外另一个跑出来的有特色的图像生成工具。
一条巨龙从云层中飞出,翱翔在一座漂浮在空中的古老城堡周围。远处的天空中飘着一朵云,云在变化中组成一个单词:Dragon
可灵:未能表现文字,也未能理解龙、云、 Dragon 文字三者的关系,于是龙自己在古堡的上方飘着,略显尴尬。
海螺:巨龙飞过,文字飘出,Dragon 的颜色和字体都和视频环境保持了一致性,不足的是字体不是云变化而成的。
每次做视频都要加上片尾,带上来源,之前都是用剪映的花字,既然现在海螺支持文字里,就突发奇想让海螺生成一个片尾。
一块彩旗在空中飘着,旗上写着两个单词:ORANGE AI
指令超级简单,没想到第一次就出了非常好的结果,写着 Orange AI 的彩旗在风中飘扬,文字和彩旗的变化非常一致,一开始第一个字母 O 没展开,还有点失望,没想到接下来就完美地展开了。
这个片尾我给个满分。
以上,就是今天的全部内容了。
文章来自于微信公众号“橘子汽水铺”,作者“ orangesai”