# 热门搜索 #
搜索
AI视频模型六维测试:海螺视频vs可灵AI
3723点击    2024-09-04 15:15


前几天 MiniMax 发布了海螺视频生成模型 abab-video-1,现场体验非常炸裂。


很多朋友跑来问我,这个海螺视频模型和可灵的区别主要是什么?


于是我做了一个短片,来从六个维度展现这两个视频模型的不同之处。


一句话总结海螺视频就是:美学升级,运镜加分,表情丰富,文字突出。



BTW,可灵已经不免费了,目前售价是58元/月还挺贵的,而海螺视频目前限免体验中,珍惜这种随便吃吃到饱的美好时光吧。


体验地址:https://hailuoai.com/video


美学表现


众所周知,美学表现非常重要,同样都是SD模型,MJ以超高水准的美学表现赚得盆满钵满。美学是刻在模型骨子里的,光有数据还不够,还要有优质数据才可以。


黄昏时分,一艘幽灵船缓缓驶入被极光笼罩的北极海域, 船身散发出神秘的蓝光。


可灵:从风格看,偏写实一些,像是没有加滤镜的 iPhone 照片,水面的流动表现不足,船的动态和运镜都比较小,突出一个真实。


海螺:风格梦幻,黄昏时分,紫色晚霞,蓝色幽光。极光飞速飘舞,水流灵动,船体飘着蓝色的水雾,属于梦幻世界里才会有的场景。


镜头控制


好的运镜可以让视频画面呈现出动态感和高级感。


跟随镜头,侏罗纪世界的绿色森林, 一只霸王龙飞奔到画面中央,转头看向观众


可灵:镜头微微转向,拍摄位置静态不变,缺少一些灵动。


海螺:镜头随着恐龙的移动变化,让恐龙的头部一直位于画面的中心位置,似乎一直在和恐龙进行互动,让环境也变得更加立体。


面部表情变化


观众对人物表情非常敏感,面部表情的变化可以直接带动观众的情绪。


特写镜头:一个间谍在密室里解开密码, 脸上闪过紧张、困惑、恍然大悟和得意的表情。


可灵:表情几乎没有变化,但仔细看能感觉到有一丝微笑


海螺:从眉头紧皱,到舒缓谈话,到开心地笑起来,透过表情看到了角色的内心


多人面部表情


多个人物可能具备不同的面部表情,两个角色的表情能够展现人物的关系。这是一个超难的指令。


四个人坐在沙发上,一个人在哭,一个人在笑, 一个人在愤怒,一个人在犯困


可灵:三个人物的表情都是在哭,并未表现多人物的表情,还少了一个人


海螺:四个人物的表情各不相同,基本满足了指令要求,考虑到这个指令的难度,超出预期。在最后几秒中间的两位男性表情复杂了起来


复杂提示词理解


在复杂的环境和动态中考验模型的能力。这个指令包含着复杂的超现实环境、风格化的要求、主要人物、飞行物,也很难。


在一个蒸汽朋克风格的城市里, 一个机械师骑着会飞的自行车穿梭于 高耸的齿轮塔之间,追逐一只会发光的机械鸟。


可灵:城市、机械师、鸟都有,但是画面风格比较灰暗,少了重要的齿轮元素,鸟也没有发光。还是现实感强一些。


海螺:齿轮塔、机械师、发光的鸟,金铜色的画面,风格非常梦幻。


文字表现


视频中的文字,价值可以参考 Ideogram,MJ 之外另一个跑出来的有特色的图像生成工具。


一条巨龙从云层中飞出,翱翔在一座漂浮在空中的古老城堡周围。远处的天空中飘着一朵云,云在变化中组成一个单词:Dragon


可灵:未能表现文字,也未能理解龙、云、 Dragon 文字三者的关系,于是龙自己在古堡的上方飘着,略显尴尬。


海螺:巨龙飞过,文字飘出,Dragon 的颜色和字体都和视频环境保持了一致性,不足的是字体不是云变化而成的。


片尾


每次做视频都要加上片尾,带上来源,之前都是用剪映的花字,既然现在海螺支持文字里,就突发奇想让海螺生成一个片尾。


一块彩旗在空中飘着,旗上写着两个单词:ORANGE AI


指令超级简单,没想到第一次就出了非常好的结果,写着 Orange AI 的彩旗在风中飘扬,文字和彩旗的变化非常一致,一开始第一个字母 O 没展开,还有点失望,没想到接下来就完美地展开了。


这个片尾我给个满分。


以上,就是今天的全部内容了。


文章来自于微信公众号“橘子汽水铺”,作者“ orangesai”


关键词: AI , AI视频 , 海螺视频 , 可灵AI
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0