ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
VBench评测第一,5周访问量暴增8倍多! 这款国产AI视频生成器「压番」Runway
3509点击    2024-10-11 14:35

「这可能是目前国内最好的视频大模型。」


家人们,这难道不是一部电影的切片?



来自@StevieMac03(I2V,图生视频)


谁能不被这头苏醒过来的小飞象萌化?


使用了图生视频(I2V)last frame功能,来自@alexgnewmedia


讲真,要不是在 X 上晃悠时突然被这几个视频 「砸中」,咱还真不知道 MiniMax ,中国估值最高的大模型公司之一 ,又闷声整了个大活儿。


绷不住了,咋说碎就碎?



魔法降临,石膏天使也会醒来。



这些海外「自来水」们秀出的「魔法」,正出自海螺 AI 10 月才上线的新功能「图生视频」。


五周前,MiniMax 发布了视频模型 abab-video-1,并在海螺 AI 网页版上线了视频创作入口(主要是文生视频),正式入局 AI 视频赛道。


旋即,海螺 AI 在过去一个月内迎来爆发式增长,月访问量超 8 倍, 增速领跑全球 AI 产品。


在 AI 产品榜·网站榜( web )上,海螺 AI 网页版 9 月访问量在两个增速榜排名第一,全球增速榜 TOP 1、国内增速榜 TOP 1,增速高达 867.41%。



海螺 AI 官网链接:https://hailuoai.com/video


封印解除,创意狂欢


2024 年,没有比 AI 视频生成更「卷」的战场。


海螺 AI「出征」不算早,上线仅过月余,就吸引了大批专业人士,包括电影导演、制片人、数字艺术家、游戏开发者、KOL 等,遍布全球 180 多个地区。


无论创作者想要创作超现实主义作品、探索幻想和科幻主题,还是深入研究动漫和抽象视觉效果,海螺 AI 都能提供广泛的选择,满足不同创作需求。


一系列恶搞英国「地狱厨神」Gordon Ramsey 的 AI 视频,火爆出圈,网友用的正是海螺 AI 。


这位以爆粗口闻名的厨师总是卷入各种奇怪场面,要么和一只夹住裆部的龙虾搏斗,要么穿着 Slayer(美国重金属乐队)的 T 恤敲打肉排,又或者坐在厨房中间的马桶上。


再配上欢快的背景音乐,整个喜剧效果拉满。



现实题材中,情绪表达一直是一个难题——无论是对 AI 、还是明星来说,但「自来水们」已册封海螺 AI 为「动画表情之王」。


AI 设计师 Pierrick Chevallier 用过后惊呼「细节和真实感已经属于另一个 Level 了。」


来自Pierrick Chevallier | IA @CharaspowerAI


新加坡电影导演 EHuanglu 用它生成了一位女性的面部特写( T2V ),从快乐到悲伤,最后捂脸哭泣,情绪变化演绎相当到位。


该视频已有近 30 万次观看,评论区上百位网友争相抄作业。



科幻创作,也是很多专业人士、AI 爱好者一展创意的重要场景。


知名导演 Dave Clark 第一次利用海螺 AI 创作的星球大战片段( T2V ),一度在网络疯传。



试用了最新的图生视频( I2V )后,这位导演直言,「我一直在等待这种类型的恐龙运动。」



这只外星生物的面部细微动作( I2V ),可还行?


来自Alexandra Aisling@AllaAisling


动漫题材( I2V )也不在话下。请注意,主人公的鞋子细节。


来自@02121976_yama2


除了提供广泛的风格选择,媲美电影的质感也给海螺 AI 再上大分。


看看这个视频( T2V )。人物身体运动、情感表现以及整体画面质感,越来越接近纯粹的电影。


来自Particle Panic@Magiermogul


据说,海螺 AI 不用特效模板,只依靠模型综合能力实现最顶级的影视特效。



有导演曾在电影中使用 3D 软件进行这种灾难场面制作,但要达到类似效果非常困难。


现在,海螺AI( I2V )可以轻松完成。


来自tabi_yume@U7991688174711


一些网友、YouTube 主在比较海螺 AI 与最好的视频生成器 Runway、国内快手的可灵后发现,在生成运动方面,海螺 AI 明显属于下一个 Level,尤其是人体动作的流畅性和逼真性,比 Runway、Luma AI 等竞对都要好。


有博主甚至认为,在人物动作上,海螺 AI 的性能足以媲美甚至超越市面上其他领先的 AI 视频生成器。


你看,这个视频中( I2V )的女人转向一侧,从眼镜、头发、衣服到所有东西,均保持一致,海螺 AI 合乎逻辑地填补了缺失信息!



一位电影制作人使用海螺 AI( I2V )后觉得很疯狂。


看第一帧,只能看见怪物的一只胳膊和手。但海螺 AI 居然可以自己「脑补」出新胳膊和手,还完美地融入了现有视频。


来自 Uncanny Harry AI@Uncanny_Harry


X 用户 Heather Cooper 曾发起线上投票,针对同样的提示,谁的表现最好?


评论区多数人将票投给了海螺 AI。


来自Heather Cooper@HBCoop_,提示词,"Tracking shot of a curator standing and speaking to the camera as she welcomes museum guests. Warm, inviting atmosphere."



除了生成动作方面的领先,几乎所有用户都承认海螺 AI 文本响应很好,能够较为准确地将提示词中的元素体现在视频中。


士兵转向摄像机,走向镜头,并用枪对准它,海螺 AI 抓住了每一个方位细节。



严格遵循指令中的运镜要求,也是一个典型例子。


凭借对 90 年代人物着装风格、建筑样式的准确还原,以及特殊鱼眼镜头下滑板动作的精准把控,这个视频让海螺 AI 在 reddit 中迎来好评。



目前,海螺 AI 视频模型在 VBench(视频生成模型评测框架)的第三方独立测试结果中综合排名第一,在画面质量、连贯性、流畅性等多维度均处于领先地位。



最近,香港中文大学和腾讯研究人员通过「 VideoGen-Eval 」项目,对当前主流AI视频生成模型进行了全面评估,肯定了海螺 AI 在文本控制方面突出能力,尤其在人物表情、运镜、多镜头生成和主体动态方面表现优异。


除了老司机,对于此前未接触过 AI 的新人而言,海螺 AI 也非常友好。


一位名叫 Ksenia_Galushkina 的艺术家新手,花了两天半时间,用海螺 AI 生成 80 多条视频,制作完成了这条迷你艺术片。



超「戏精」的海螺 AI,要干掉好莱坞?


俗话说得好,光说不练假把式。海螺 AI 视频模型的实力究竟如何,还得看一手评测。


接下来,我们从海螺 AI 的拿手绝活开始试水。


 打个响指,金箍棒秒变笛子


海螺 AI 上新的图生视频功能,不仅能准确识别上传的图片,还能准确理解超过图片内容之外的复杂文本。


换句话说,创作者可以化身任性的导演,只需下个指令,海螺 AI 就会发挥充分的想象力予以实现。


例如,让《武林外传》中的佟掌柜和邢捕头,上演一出苦情戏。



(图生视频。Prompt:女人悲伤地哭了起来,男人抱住并安慰她。)


不得不说,海螺 AI 的生成效果相当惊艳。佟掌柜眉一皱、嘴一撅,哭泣的表情非常逼真,邢捕头拥抱的动作也很自然流畅。


更难能可贵的是,虽然表情变化和动作幅度都较大,但画面并未崩坏。


再比如被网友玩坏了的「分心男友」经典梗图。我们输入 Prompt:穿红衣服的女生转身,三个人拥抱在一起。



海螺 AI 完美遵循了文字指令,红衣女子转身,和身后的一对情侣拥抱,整套动作一气呵成,没有任何卡顿。


尤其是六只胳膊交叠在一起,很容易出现扭曲变形,但它生成的视频中,几乎没什么明显的 bug。


我们还拿它各种「折腾」世界名画《蒙娜丽莎》。



(Prompt:蒙娜丽莎拿起手机,然后打起了电话。)



(Prompt:蒙娜丽莎戴上墨镜。)


海螺 AI 很会「无中生有」,手里要么掏出个大哥大式儿的手机,扣在耳边假装打电话;要么摸出个赛博朋克风格的墨镜,骂骂咧咧地架在鼻梁上,光影、色调等细节处理得都挺到位。


最让人惊喜的,还得是它对图片中物品的精准控制。


比如那张著名的地铁老人看手机的表情包。


不少人应该都见识过他吃手机的 AI 视频,这次我们来一次难度升级:老人拿着的手机变成鸡腿,并吃了起来。



上一秒老人还嫌弃地看着手机,下一秒就变成了鸡腿,然后大快朵颐。


为了体现地铁的高速运行,海螺 AI 对背景的渲染也很逼真,窗外的绿树快速后撤,环境不断变化,增强了沉浸感。


还有让猴哥的金箍棒秒变笛子,由此可见,海螺 AI 能够很好地解构指令框架和深层语义,并在视频生成中加以整合。



(prompt:男子手中的棍子变成了笛子。)


 一张自拍 + 一个目的地,想去哪就去哪


在电影《镜像世界》中,导演使用大量特殊镜头和后期制作技术,让小哥从镜子中穿越到另一个时空。



而现在要完成这一效果,只需要一张自拍和一个目的地,海螺 AI 就能实现「跨屏」联动。


例如,将一位美女的照片和一幅风景图拼在一起,然后输入 prompt:女子走向绿地,站在草地上,望着美丽的湖面,镜头缓缓左移。



来瞅瞅效果:



右边的美女完美融合到左边的草地场景中,并且主体从原场景进入目标场景后,光影、色调都会完美嵌入新场景的设定。



(prompt:女子走向红色的森林列车,镜头缓缓左移。)


海螺 AI 按照文字描述,镜头随着女子的运动轨迹而移动,拼接处也逐渐消失。


轻松搞定好莱坞级特效


AI 时代,要有一颗会整活儿的心。


网友们就开发出各种特效玩法,比如 CG 合成、碎片化、变身、爆炸、流体……


要知道,特效这玩意儿,那是嘎嘎费钱。就拿《阿凡达》来说,它的总制作成本为 2.37 亿美元,其中特效成本就占了 1.5 亿美元。


财大气粗的电影制作公司可以狠砸真金白银,但对于独立电影人来说,一分钱都难倒英雄汉。


如今海螺 AI 不用特效模板,只依靠模型综合能力就能轻松实现好莱坞级别的特效,真・人人都能当导演。


X 网友 Stylez Morales 就用了一张图和一句提示词,得到一段变身特效镜头。


一个变形金刚机器人突然变身成一辆超跑,在赛博朋克的街道上疾驰,这画面,真有一种电影级别的超现实视觉效果。



(Prompt:dramatic action scene dynamic camera shot of a transformer robot running down a futuristic dystopian cybersteampunk street avoiding explosions and transforms into a highly advanced supercar to get away atmospheric cinematic hyperreal photorealistic award winning blockbuster movie directed by Michael bay)


再比如拟人特效。毛茸茸的玩具小鹿突然奔跑起来。



(Prompt:小鹿向前跑动。)


玩具小狗突然「复活」,还招朋引伴。



(Prompt:另一只小狗走进画面,两只小狗玩了起来。)


爆炸特效。《浴血黑帮》中的三兄弟大步流星往前走,身后的建筑在一片爆炸中摧毁。



(Prompt:三个男人往前走,后面的建筑爆炸。)


艺术审美在线


海螺 AI 在艺术审美上,也超能打。


它能用专业级调光与构图营造美学氛围,精细控制光影效果与景别变化,画面质感媲美大片。


比如一只拟人化的小羊在森林里跳舞。


画质高清,镜头缓慢推进,毛茸茸的小羊羔蹦跶着,耳朵也有节奏地上下扇动,效果丝毫不输迪士尼动画。



再来看看海螺 AI 制作的时尚大片。


女模特摆着各种时尚 pose,表情自然且富有表现力,头发也会随着动作而飘动,大衣纽扣等细节也处理得很精细。



(Prompt:Fashion blockbuster, the female model strikes a fashionable pose, with the camera following closely.)


我们还上传了一张戴着墨镜、身穿西装、端着酒杯的男模特图片,然后输入 Prompt:男人开心地举起酒杯,然后从画面左侧走出来一位美女。


海螺 AI 完成度相当高,画面也没有模糊、扭曲等问题。



与 Runway 同台竞技


没有对比,就没有发言权,让海螺 AI 和 Runway 打个擂台,谁强谁弱也就一目了然。


我们就先用 OpenAI 创始四人组的照片打头阵。


上传同样的照片,输入同样的提示词:The three people sitting on the sofa stand up and walk out of the frame to the left.


这是海螺 AI 的生成效果:



这是 Runway Gen-3 Alpha Turbo 的效果:



海螺 AI 严格遵循提示词,坐在沙发上的 Ilya、Greg、Murati 站起来,向左走出画面,独留 Altman 站在原地凌乱;而 Runway 生成的画面则崩得离谱,照片中的四个人飞出沙发,完全没有遵循物理世界的运动规律,甚至还出现了脑袋 360 度旋转的诡异画面。


再来一个多人物场景。


Prompt:strong man with cowboy hat in bar drinking beer with several women


海螺 AI 生成的画面,细节更丰富,场景更复杂,人物表情也更自然。



相比之下,Runway 的镜头较为简单,男子喝啤酒时,杯中的啤酒没有减少,左边女生的手部也出现了莫名其妙的动作。



Prompt:flying toward of a wide shot of an extremely large nuclear powered monster emerging from a fierce storm vortex walking over a city, epic shot in a cinematic fashion, pure destruction.


海螺 AI 的电影质感、画面丰富度更高,怪兽展现得也更生动。



Runway 则直接缺失了怪物主题,没有准确理解 prompt 的含义。



这可能是目前国内最好的视频大模型。


而在已经体验过的人群中,他们毫无例外地将海螺 AI 归入第一梯队。


如果说,9 月的海螺 AI 已经令人印象深刻,那么,新增 「图生视频」的海螺 AI 又更上一层楼。它并不完美,但比大家试过的许多 AI 视频模型都要好。


神奇海螺的智慧和魔力是不容被质疑的,既然 Sora 迟迟不来,为什么不问问神奇海螺呢?


大家还等什么?快去体验一波吧。


海螺AI官网链接:https://hailuoai.com/video


文章来自于微信公众号“机器之心”,作者“关注大模型的”


关键词: AI , AI视频 , VBench , 海螺AI
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0