ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI视频模型六维测试:海螺视频vs可灵AI
4041点击    2024-09-04 15:15


前几天 MiniMax 发布了海螺视频生成模型 abab-video-1,现场体验非常炸裂。


很多朋友跑来问我,这个海螺视频模型和可灵的区别主要是什么?


于是我做了一个短片,来从六个维度展现这两个视频模型的不同之处。


一句话总结海螺视频就是:美学升级,运镜加分,表情丰富,文字突出。



BTW,可灵已经不免费了,目前售价是58元/月还挺贵的,而海螺视频目前限免体验中,珍惜这种随便吃吃到饱的美好时光吧。


体验地址:https://hailuoai.com/video


美学表现


众所周知,美学表现非常重要,同样都是SD模型,MJ以超高水准的美学表现赚得盆满钵满。美学是刻在模型骨子里的,光有数据还不够,还要有优质数据才可以。


黄昏时分,一艘幽灵船缓缓驶入被极光笼罩的北极海域, 船身散发出神秘的蓝光。


可灵:从风格看,偏写实一些,像是没有加滤镜的 iPhone 照片,水面的流动表现不足,船的动态和运镜都比较小,突出一个真实。


海螺:风格梦幻,黄昏时分,紫色晚霞,蓝色幽光。极光飞速飘舞,水流灵动,船体飘着蓝色的水雾,属于梦幻世界里才会有的场景。


镜头控制


好的运镜可以让视频画面呈现出动态感和高级感。


跟随镜头,侏罗纪世界的绿色森林, 一只霸王龙飞奔到画面中央,转头看向观众


可灵:镜头微微转向,拍摄位置静态不变,缺少一些灵动。


海螺:镜头随着恐龙的移动变化,让恐龙的头部一直位于画面的中心位置,似乎一直在和恐龙进行互动,让环境也变得更加立体。


面部表情变化


观众对人物表情非常敏感,面部表情的变化可以直接带动观众的情绪。


特写镜头:一个间谍在密室里解开密码, 脸上闪过紧张、困惑、恍然大悟和得意的表情。


可灵:表情几乎没有变化,但仔细看能感觉到有一丝微笑


海螺:从眉头紧皱,到舒缓谈话,到开心地笑起来,透过表情看到了角色的内心


多人面部表情


多个人物可能具备不同的面部表情,两个角色的表情能够展现人物的关系。这是一个超难的指令。


四个人坐在沙发上,一个人在哭,一个人在笑, 一个人在愤怒,一个人在犯困


可灵:三个人物的表情都是在哭,并未表现多人物的表情,还少了一个人


海螺:四个人物的表情各不相同,基本满足了指令要求,考虑到这个指令的难度,超出预期。在最后几秒中间的两位男性表情复杂了起来


复杂提示词理解


在复杂的环境和动态中考验模型的能力。这个指令包含着复杂的超现实环境、风格化的要求、主要人物、飞行物,也很难。


在一个蒸汽朋克风格的城市里, 一个机械师骑着会飞的自行车穿梭于 高耸的齿轮塔之间,追逐一只会发光的机械鸟。


可灵:城市、机械师、鸟都有,但是画面风格比较灰暗,少了重要的齿轮元素,鸟也没有发光。还是现实感强一些。


海螺:齿轮塔、机械师、发光的鸟,金铜色的画面,风格非常梦幻。


文字表现


视频中的文字,价值可以参考 Ideogram,MJ 之外另一个跑出来的有特色的图像生成工具。


一条巨龙从云层中飞出,翱翔在一座漂浮在空中的古老城堡周围。远处的天空中飘着一朵云,云在变化中组成一个单词:Dragon


可灵:未能表现文字,也未能理解龙、云、 Dragon 文字三者的关系,于是龙自己在古堡的上方飘着,略显尴尬。


海螺:巨龙飞过,文字飘出,Dragon 的颜色和字体都和视频环境保持了一致性,不足的是字体不是云变化而成的。


片尾


每次做视频都要加上片尾,带上来源,之前都是用剪映的花字,既然现在海螺支持文字里,就突发奇想让海螺生成一个片尾。


一块彩旗在空中飘着,旗上写着两个单词:ORANGE AI


指令超级简单,没想到第一次就出了非常好的结果,写着 Orange AI 的彩旗在风中飘扬,文字和彩旗的变化非常一致,一开始第一个字母 O 没展开,还有点失望,没想到接下来就完美地展开了。


这个片尾我给个满分。


以上,就是今天的全部内容了。


文章来自于微信公众号“橘子汽水铺”,作者“ orangesai”


关键词: AI , AI视频 , 海螺视频 , 可灵AI
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0