谷歌Veo 3.1又双叒升级了!
除了全方位提升视频生成质量,这一次还有两个关键词:竖屏和4K。
没错,谷歌也紧随Sora步伐,正式吹响了进军短视频的号角,而且还一口气把视频画质拉满了。
只需提供一张竖屏图片,外加一句简单的提示词,Veo 3.1就能立马生成小浣熊在咖啡店打工的视频。
纪录片风格、一只浣熊经营一家咖啡店、对话。

随机上传3张看起来毫不相关的图片,Veo 3.1还能施展融合大法,将它们自然组合成一个视频。
想象一下,一场时装秀上,模特们在一座完全由闪闪发光的水晶建造的大教堂里翩翩起舞。

而对于Veo 3.1的此次更新,按谷歌CEO劈柴的话来说就是:
没别的,就是想帮大家圆梦(我们听到了大家的呼声!

至于圆了哪些梦,咱这就揭晓——
Veo 3.1是谷歌去年10月发布的一个视频模型版本,这一次算是时隔3个月后的小幅度更新。
不过,虽然在官方眼里事小(未将这次更新列为一个新版本),但它实际上却有重大意义。
因为它清晰地宣告,谷歌这家巨头已经正式踏入AI短视频的竞技场。
为了满足短视频需求,升级后的Veo 3.1具备两大核心功能:
下面这个视频清晰展示了画质的前后对比:

而在保证“外在形象”符合短视频模式后,Veo 3.1也做了很多“内修”工作,将各种生成技能再往上拔高了一截。

一是提升了创意能力。
和以往相比,现在即使只提供非常简单的提示词,模型也能根据参考图片和提示词生成各种小剧场。
我是一名歌剧演员。

二是一致性大幅改进。这主要包括两方面:
比如,让一位本来在街头行走的女士登上火星,虽然前后景差距很大,但人脸仍旧保持一致。
我穿着宇航服在火星上行走。

难度再高点,让人和老虎始终出现在同一个画面里,整个过程也相当自然。
一幅皇帝与他的白虎并肩而行的中景画面。

三是元素融合能力大幅改善。
只需简单描述,两张照片中的角色、物体、纹理和风格化背景等,都能融合在一起形成连贯视频。
社交媒体类型的ASMR视频,我将通过在脸上绘制3D花朵并讲解整个化妆过程来进行教学。

目前上述功能已面向所有谷歌用户推出。
对普通消费者来说,可以通过YouTube Shorts、YouTube Create以及Gemini应用体验。
而对企业或专业用户来说,则可以通过Flow、Gemini API、Vertex AI和Google Vids等平台使用。
手快的网友们已经尝鲜上了,来感受一波实际效果:

虽然网友这里选了横版,但对照三张原图,肉眼可见融合效果确实不错,而且运镜很有电影感。

另一位日本网友则用它生成了虚拟偶像组合,别说还挺像样。

换成竖版,用它来制作近来很火的AI动漫也OK。

Anyway,谷歌这波更新的目的已经很明确了——
通过提供竖版AI视频,吸引并服务更广泛的移动端用户。
而这一举动,无疑为“AI视频竖屏化”这一已见端倪的趋势,再添一把火。
让AI视频竖屏化,谷歌并非第一家。
远的不说,国外排在谷歌前面的就有OpenAI和迪士尼。
OpenAI早在去年就推出了独立的Sora应用,玩法也和我们熟悉的抖音差不多,因此Sora APP也一度被视为“AI版抖音”。
虽然这款应用一开始确实引发无数网友跟风尝鲜,但后来的一份数据显示,Sora APP的用户留存率似乎令人堪忧——
上线之后,一路从10%(day1)降至2%(day7)、1%(day30)……
而在当时的分析中,原因最终被归结到了“OpenAI不擅长运营”这一点上。
因为在OpenAI首席研究官Mark Chen看来,“OpenAI本质上仍然是一家纯AI研究公司”。
对应的潜台词即为,即使打造出了Sora APP这样一款强大的应用,但一些后续运营对OpenAI来说仍是不小的挑战,何况这种短视频产品对运营的依赖更重。
而运营在谷歌这里,难度貌似就没有那么大了。毕竟谷歌最重要的王牌就是它的全栈运营能力,除了自家的Gemini应用,它还手握YouTube这样的全球热门视频平台。
这就意味着,谷歌不仅有技术,更有平台、流量和创作者生态的闭环优势。
从生成工具到发布渠道,再到推荐算法和用户反馈,YouTube本身就是一个已被验证的、成熟的视频内容运营系统。
而Veo的竖屏视频可以直接适配YouTube Shorts,这不仅降低了创作者的分发门槛,更让谷歌能在用户使用数据中快速迭代模型,形成“创作—分发—反馈—优化”的正向循环。
所以对谷歌来说,让AI视频竖屏化归根到底只是一个时间早晚的问题,而且它还具有后发优势。
而除了谷歌和OpenAI这样的AI玩家,迪士尼也正在将竖版视频引入自家流媒体平台Disney+。
在今年的CES期间,迪士尼宣布将在今年晚些时候引入类似短视频平台的竖屏内容信息流。
这一动作无疑再次印证了,视频时代竖屏模式的重要性。
而且它去年底还和OpenAI达成了合作,将把OpenAI的视频生成能力引入Disney+,这也意味着,以后在Disney+也能刷到AI生成的短视频了。
从这些不同领域、但各自引领行业潮流的玩家的动作来看,“AI视频竖屏化”确实已经是一个渐趋明显的信号。
而且不止国外,我们国内的AI玩家也早就进行了相关尝试——
只需看一眼可灵AI、Vidu AI(下图)这些国内视频生成应用,你就会找到熟悉的玩法和感觉。

真要说起来,如果将这套短视频玩法搬到AI领域,或许我们国内玩家更有经验呢(doge)。
参考链接:
[1]https://www.theverge.com/news/861257/google-veo-3-1-ai-video-ingredients-vertical-update
[2]https://x.com/i/trending/2011123997128155440
[3]https://blog.google/innovation-and-ai/technology/ai/veo-3-1-ingredients-to-video/
文章来自于“量子位”,作者 “一水”。
【开源免费】MoneyPrinterTurbo是一个可以让用户通过关键词和文案就可以生成高清短视频的项目。
项目地址:https://github.com/harry0703/MoneyPrinterTurbo
在线使用:https://reccloud.cn(付费)
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0