谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷
5217点击    2025-07-10 13:21

图片也能开口说话了!昨晚,谷歌Veo 3全新升级,上传一张照片即可生成音频和视频,角色一致性更是达到新高度。


刚刚,AI视频顶流Veo 3重磅升级。


这一次,只需一张图即生成音频+视频大片,进入谷歌Flow创作平台即可体验。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


同一个角色,能在多个镜头下,保持高度一致性。就连星际迷航类型的科幻片,Veo 3可以一键复刻出来。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


还有网友直接用Veo 3拍了一部「巨魔之死」的预告短片,音效、人物一致性极其震撼。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


Veo 3如此炸裂的效果,如何体验?


图片张口说话了


在进行实测后,感叹Veo3的视频生成表现力真的令人惊艳。


钢铁侠竟然可以开口说话了!看了让人头皮发麻。


本次使用的图片如下,提示词为「let him talk something」


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


生成效果非常惊艳!Veo3生成了两个版本的视频。


第一个比较「正经」,是类似变形金刚中擎天柱的风格。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷

第二个就比较「符合」钢铁侠本人的风格。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷

整体来看,这两个视频和初始图片的一致性非常之高,画面运镜也没有任何不和谐之处。


本次更新需要在Flow平台下进行,选择「Frames to Video」的选项,就能从一张图片开始生成视频。


需要注意的是,在Gemini Veo3入口目前还无法使用该项功能。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


可以选择首帧,并进行调换来设置想要生成视频的内容。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


这里也需要注意,同时选择首帧和尾帧,是无法使用Veo3的,只能使用Veo2。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


值得一提的是,此次更新,加入非常丰富的运镜功能,比如Dolly in推镜头,指的就是摄像机沿轨道向前移动。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


这是以上所有运镜功能的总结,给大家参考。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


同时,也用奥特曼做了测试,这次我们只给了图片,没有给出任何文本提示,Veo3依然进行完美的配乐和动画创造。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


最后,你可以通过选择更好的Quality模型,生成质量更高的视频,但要消耗更多的credits。


Quality消耗的是Fast的5倍,Fast消耗20credits,Quality是100credits。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


关于此次更新更多改进,可以查看谷歌官方的更新文档。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


网友实测


Veo 3更新后,网友第一时间开启了测试。


有人表示,图像带音频的视频生成,堪称是AI叙事领域的一大突破,尤其是前后一致的角色


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


包括人物角色的表情非常自然,表演也很到位。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


还有前段时间,比较火爆的第一视角AI视频生成,Veo 3基于图像的生成同样令人惊艳。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


再看这位老人,带着巨大的笑容说着,「谷歌刚刚更新了Veo 3,而且Veo 3在Flow上速度很快,但他们还没把它带到Gemini应用里」。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


提示词:

{  

"shot": {    

"composition": "Medium close-up, 85mm lens, shot on ARRI Alexa Mini LF, shallow depth of field, static camera",    

"camera_motion": "locked off",    

"frame_rate": "24fps",    

"film_grain": "light Kodak 250D grain overlay" 

},  

"subject": {    

"description": "An elderly woman with exaggerated, cartoonish features: enormous toothy grin stretching nearly ear to ear, deep crow’s feet around wide, manic eyes, a long thin neck with pronounced tendons, and wild silver hair pulled back in a loose bun with stray wisps. She wears a bright blue floral blouse with pink hibiscus flowers and small silver hoop earrings.",    

"wardrobe": "bright blue floral blouse with pink hibiscus print, silver hoop earrings" 

},  

"scene": {    

"location": "studio backdrop",    

"time_of_day": "indeterminate, evenly lit",    

"environment": "smooth gradient background in lavender to mauve tones, minimal distractions" 

},  

"visual_details": {    

"action": "the woman leans slightly forward toward camera, her enormous grin widening unnaturally, eyes bulging with gleeful intensity as she clasps her bony hands together just below her chin",    

"props": "none" 

},  

"cinematography": {    

"lighting": "soft key light slightly overhead, gentle fill to reduce shadows, creating an uncanny hyperreal clarity on her wrinkles and teeth",    

"tone": "darkly comedic, unsettling" 

},  

"audio": {    

"ambient": "faint hum of studio lights",    

"voice": "old, raspy, whispery with a gleeful, creepy lilt" 

},  

"color_palette": "muted pastels with pops of saturated pink and blue, creating an eerie contrast",  

"dialogue": {    

"character": "Elderly Woman",    

"line": "Google just updated Veo3… and Veo3 fast on Flow… but they didn’t bring it yet to the Gemini app… (giggles, then erupts into a raspy, unhinged laugh)",    

"subtitles": false 

}
}  


还有网友上传一张Midjourney生成的图片,再交由Veo 3配音+视频画面,瞬间定制一款独特的香奈儿广告。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷

就连动画领域,Veo 3也没有放过。


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


谷歌Veo 3逆天升级,照片秒变活人开口讲话!广告动漫圈一夜沦陷


参考资料:


https://x.com/venturetwins/status/1942371183644794987


https://x.com/Diesol/status/1942452185259991246


https://x.com/TawohAwa/status/1942547376121725096


https://www.youtube.com/watch?v=-xthML25JOs


文章来自于微信公众号“新智元”。


关键词: AI新闻 , AI视频 , Veo 3 , 谷歌AI
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0