# 热门搜索 #
搜索
Sora 平替出现了!字节 Dreamina 开放测试,申请就给用|AI 鲜测
2542点击    2024-04-22 17:50

最近,字节旗下的一款视频生成AI——Dreamina 开始大规模开放测试。


Dreamina 不算是新产品,但现在它与 Sora 最大的区别,不是模型能力,而是它真的是能使用的。



虽然有人觉得 Dreamina 生成出来的视频可能会有一些“抽象”、“幻觉”,但这是跟 Sora 来比。


Sora 在过去两个月用一系列视频拉高了人们对于文生视频的预期,似乎所有文生视频的产品到不了 Sora 的水平都是垃圾。



我觉得这是落入了 OpenAI 的陷阱,一款无法使用的产品只能叫做概念。所以我一直觉得 Sora 这个概念是挺厉害的,但并不在商用产品的范畴当中。


在拿到 Dreamina 的测试资格后赶紧上手试试,体验下来效果远远超出我的预期!(现在申请大概一两天就能通过)


Dreamina,你到底有啥绝活?


话不多说,今天咱们就用10个案例告诉你它行不行!


首先第一个就是前段时间被刷屏的 Sora 生成的长镜头。我们用同样的提示词来试一下效果如何:


  • 看这效果,背景跟人挺般配的,看得出它秒懂我们的意思!人倒也画得不错,不过就是脸有点飘!


再仔细一看,人物的衣褶阴影与环境光影变化同步,肤色与周围色温协调一致,整个场景浑然一体,仿佛就是一个真实存在的空间。这种高度的融合感,体现了Dreamina 对场景理解的深度。整体画面似乎能摸到 Sora 的一点感觉,不过差距还是有


对于动物的处理,能看出来似乎是在走动,但其实细看还是有点别扭。


Dreamina 生成的视频在光影质感方面的表现可圈可点,基本具备了电影级别的画面感。逆光、斜射、散射等各种复杂光线都能得到准确的模拟,比如大象周围的光线洒在雪地上,黄昏余晖对天空和雪山的晕染。


  • 不仅是真实运动,连动物跳舞也不在话下,跳得可带劲了!即便如此,视频动作过快也避免不了主体会出现手断指的情况!


虽然 Dreamina 在人体动作的整体模拟上已经做得不错,但在面部表情、手指动作等细节方面还比较粗糙,特别是在长时间特写镜头下,人物的细微表情变化往往不够到位,显得有些呆板

  • 再来看看人物特写,人物脸部的光影传达出一种很唯美的氛围。


与其他一些AI工具不同的是,Dreamina 内置了比较完善的内容审核机制,可以有效过滤掉暴力、色情等不良信息,为用户提供一个相对健康良性的创作环境。这对于青少年用户来说尤为重要。


  • 物理运动模拟真实到位,动起来贼6,跟真的一样!


先来看看镜头内物体运动理解和生成的效果如何


视频中海浪打在岸上,运动轨迹特别真实,这里 Dreamina 严丝合缝地遵循着物理规律,毫无违和感。同时镜头在顺时针旋转,给人感觉十分流畅。这足以证明 Dreamina 在物体运动的模拟上可以说是一绝!


这里测试镜头多个主体同时运动的效果,我调整了视频的参数,选择了「保持、快速、16:9」



可以看到整个画面中有多个物体同时运动,每条鱼不仅运动时快速流畅,而且还没有太大的变形,在物体运动这块能做到这样的效果,这里给 Dreamina 上大分!


不足的是视频长度太短,而且延长会变模糊。下面就是个典型的例子


视频清晰度高,但持续时长内一致性略有波动。当视频延长到6秒时,人物扭头前后部分不太连贯,开始变得模糊,进而导致整体一致性不够稳定,时有"崩坏"发生,影响了整体观感。这一块儿离Sora的"分钟级"还有段距离!对于一些需要长时间连贯表现的创意内容,比如MV、宣传片等,Dreamina 可能还不太能胜任。


测试到这儿,想要得到更好的效果,AI视频生成还是免不了大量“抽卡”!


整个视频对提示词的理解很到位,同时生成的动物表情很生动!不过表情细节有待加强,另外蜡烛比 Sora 生成的大很多,火焰也有一些掉出来了。看来 Dreamina 还有很长一段路要走!


目前 Dreamina 生成的视频在镜头语言上还比较单一,基本上就是固定、推进、拉远、顺时针旋转、逆时针旋转等运动镜头,缺乏丰富的画面调度。这在一定程度上限制了专业用户的创作自由度,不利于用户更好地创作。


尽管 Dreamina 目前还主要面向十几秒的短视频领域,但其整体生成效果之出众,已经完全超越了大多数真人创作的同类型内容。流畅的动作衔接、合理的场景切换、动人的光影氛围......种种亮点汇聚在一起,足以让大多数短视频爱好者叹为观止。站在这个角度看,Dreamina 在短视频领域可谓是一匹黑马,前景不可限量!



一句话:Dreamina,你还得努努力!


在一番上手实测后,不得不说,Dreamina 确实有点东西!


说实话,Dreamina 确实没有 Sora 那么强,比如人物动作有时候还是有点僵硬,面部表情也略显呆板、时长清晰度也有待提升。但它绝对能用!特别是模拟物理运动、自然切换场景、背景和主题契合度确实让人眼前一亮!


再给它点时间!


文章来自微信公众号”硅星GenAI",作者 椒盐玉兔




00:03


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0