Adobe全面进军AI生成领域!
就在2024年的Adobe MAX大会上,Adobe正式推出Firefly视频模型,以及最新升级的图像模型。
相比于一次只生成1~5秒的视频生成模型,将GenAI的能力无缝集成到视频编辑软件中,无疑是最能直接提升生产力的方式。
视频编辑——Adobe表示,你要说这个我可就不困了。
毕竟,Premiere Pro已然是最专业、应用最广泛的视频剪辑工具,很可能没有之一。
剪视频的时候,突然发现素材缺帧、色调不对、机位卡不上?基于Firefly Video模型的新功能Generative Extent,就可以免去用户重新拍摄素材的麻烦。
Adobe表示, Generative Extend是他们推出的第一个由视频专业人士打造,且专门服务于专业人士的Gen AI功能,并且具有可靠的商业安全性。
不仅只在Adobe有授权的内容上进行训练,而且绝不会私自截取用户内容作为训练数据,可以说是稳稳接住了专业创作者的痛点。
对于视频开头、结尾,或者时间轴中的任何缺失部分,只需要一拖、一点,就能让AI快速扩展,实现完美的定时编辑。
像下图左边这种镜头中不理想的视线移动,AI也可以直接自动修正。
人物的移动范围出画了,用AI自动调整画面边界,省时省力。
想要将对齐两幅画面的背景色调?显然AI的眼睛要比人类更准,一键调色好过试色半小时。
除了画面,音频编辑功能也同样强大,选择「room tone」按钮即可对音效进行延长或平滑操作。
比如下面这个冰山坍塌的视频,虽然画面只持续了3秒多,但模型可以自动「脑补」出后面将近10秒的音效,足可以以假乱真。
但目前,音频编辑还不支持创建或扩展对话,而且由于潜在的版权问题,也不支持音乐。
下面这个示例就展示了,在只有音效但没有画面的情况下,如何使用生成式扩展功能,自动延长各个镜头画面的停留时间,在匹配音效的同时补好时间轴上的大窟窿。
成品如下,用一句「天衣无缝」来形容应该是不过分的。
生成式扩展功能将在今年晚些时候的beta版Pr中上线,Adobe表示,会在用户反馈的基础上持续更新。
比如,对于模型每一次的生成结果,都可以一键「点赞」或「吐槽」。
性能方面,Pr还和英伟达进行了集成,使用RTX系列GPU加速运行,提升用户体验。
随着互联网内容形式的进化,视频成为了当今时代互动社交的「硬通货」。
面对视频内容需求的持续增长,剪辑师、电影制作人和内容创作者需要在更短时间内完成更多工作的挑战。
而且,视频剪辑工作已不再局限于简单的画面剪切,还要包揽调色、字幕、动画、视觉效果、混音等一系列任务。
此时,Adobe作为专业的工具集,搭上GenAI提升生产力的快车,最为合适不过。
首先,Firefly的文生视频功能和Runway、Sora等视频生成模型类似——用户通过prompt即可生成任何自己想要的视频。
提示:街道中央雨中男子的电影级特写肖像。光影氛围沉郁而富有戏剧性,色调以蓝色和青色调为主。男子形象极度写实,皮肤纹理精细,脸上点缀着细密胡茬。细微的动作柔和流畅,镜头保持固定。画面呈现浓重的胶片颗粒感和质感。水珠在男子脸上缓缓滑落,清晰可见。
它可以模拟各种风格,包括逼真的实景电影效果、3D动画,以及定格动画。
而对于已经生成的视频,则可以通过一套「摄像机控制」功能对其进一步细化,包括不同的摄像机角度、运动效果和拍摄距离等参数。
用摄像机控制调整生成的视频
对于创作者来说,从此,视频项目中缺镜头将不再是问题!
通过文本提示、摄像机控制和参考图像,就能生成B-Roll(补充素材),轻松填补时间轴上的空白。
只要输入详细提示,就能生成引人入胜的插入镜头,完美融入最终作品中。
提示:夜晚街道中央,一位老年男子的电影级特写和细节丰富的肖像。光线氛围沉郁而富有戏剧性。色彩调性为蓝色阴影与橙色高光的对比。主角的皮肤纹理极其逼真细腻,毛孔清晰可见。动作微妙柔和。摄像机保持静止。胶片颗粒感。复古变形镜头。
即使时间轴不缺,为简单的镜头自动添加更多内容也只是分分钟的事。
比如下面这个小女孩用放大镜看草坪的视频:
AI可以补全出放大镜下的画面:
不需要补拍任何镜头,把AI生成画面和原视频剪辑在一起,就丰富了内容性和层次感:
有的制作团队预算有限、周转时间短,但有些创意构思镜头却难以捕捉,或者成本昂贵。
此时,就可以用Adobe Firefly来可视化和规划这些镜头,然后再进行视觉特效(VFX)制作,或者返回片场补拍。
这就大大简化了前期和后期制作团队之间的沟通流程。不仅提高工作效率,还能让创意意图在整个制作过程中准确传达。
提示:在墨西哥的美丽、光线柔和的天然井中,第一人称视角镜头。水清澈蔚蓝,闪烁着午后阳光的光芒。色彩温暖,阳光呈「魔幻时刻」(magic hour)风格。高质量,电影感。
Adobe从很多业内人士那里了解到,如果能填补时间线上那些留待稍后添加视觉效果的空白,将大大加快工作流。
这样,我们就不再需要使用「在此插入镜头」的占位符了。
从业人员可以更轻松地表达自己的创意,更顺畅地指导后续的视觉效果制作。
提示:电影般的无人机镜头,飞越广阔的红色火星地貌,地面在我们下方快速掠过,随着太阳开始升起,地平线呈红色。在镜头结束时,阳光照射到地平线上方。
提示:微距镜头拍摄一只由熔岩组成的幼龙在火山内部爬行。
而Firefly生成火焰、烟雾、灰尘颗粒、水、光斑等氛围元素的能力,更是让从业者非常兴奋!
这种功能就大大增加了现有内容的视觉深度。
在黑色或绿色背景上生成这些元素,就意味着我们可以使用混合模式,或Adobe Premiere Pro、Adobe After Effects等工具进行抠像,将它们叠加到现有视频上。
提示:黑色背景上的电影感漏光,有机质感,逼真。
下面这个视频,就是在Premiere Pro中使用屏幕混合模式之后的效果。
再比如,原视频如果是这个样子,就显得有些中二且抽象:
但叠加上AI生成的火焰特效:
就得到了下面这个成品视频。AI特效不仅和原视频搭配得很有默契,而且瞬间拉满酷炫风格。
各种风格的动画作品,也都可以一键生成。
像是2D的定格动画:
提示:在阳光明媚的美丽厨房里,炉灶上的煎锅中正在烹饪一个鸡蛋,这是一个使用毛毡制作的定格二维动画。
或者手绘风格的线条插画:
提示:手绘简单线稿,一个年轻的孩子仰望太空,脸上带着充满惊叹的表情。
还有各种类型的3D动画效果:
提示:可爱的章鱼宝宝,有着迷人的眼睛,每个触手都拿着一个茶杯,快乐地四处张望,3D渲染,Octane引擎,柔和光,梦幻般的背景虚化,浅景深,电影感。
提示:用羊毛和毛毡制成的微型可爱怪物,在一起跳舞,3D渲染,Octane引擎,柔和的灯光,梦幻的虚化,富有电影质感。
提示:「SUMMER」一词由蓬松、彩虹色的云朵组成,漂浮在美丽山脉上方的有漩涡和柔和色彩的天空中,两秒钟后,「SUMMER」一词与云朵一起消散。
在深入创作之前,如果能和动画师、动作设计师沟通意图,省去不断迭代、寻找正确风格所花费的时间。
而Firefly的图生视频功能中,我们除了可以使用文本提示,还能在旁边放上参考图像。
通过上传单个帧,就能轻松地为现有内容创建补充镜头,比如一个特写。
或者从静态照片中创建新的B-roll,让现有的图像库动起来。
提示:花朵在风中摇曳,一只美丽的蝴蝶正落在其中一朵花上。
更神奇的是,我们甚至可以改变原始镜头中的动作和意图。
比如,如果视频剪辑中有一个特定的动作,但作为剪辑师的你希望让导演重新拍摄,这时就可以使用该功能将其可视化,在保持相同外观的同时推动故事情节。
生成:
提示:一只戴着手套的宇航员的手进入画面,拔掉了黄色电缆的其中一根。电影感。
Firefly模型能够实现丰富的镜头控制,比如镜头远近(包括特写、中景、远景等)、角度和相机运动,以达到更精确的生成。
Firefly的这种专业特性,也就对用户输入的prompt提出了更高的要求。
从Adobe给出的官方demo来看,提示基本都相当详细;官方博客给出的建议也有这样一句话:提示越详细越好!
图生视频时可以仅描述画面的语义信息,但文生视频的prompt中基本都会包括光线、景别、镜头焦距、拍摄角度和机位、画面色彩与质感等十分细致深入的描述,才能指引模型生成出用户脑海中的画面。
Adobe建议的提示模板和具体建议如下:
反复迭代的过程中可以选择更新提示,也可以使用同一个较为成熟的提示但更改种子值(seed),从而快速尝试新的变化,而无需每次都从头开始。
比如下面这个demo的提示,虽然相比之下非常简短,但基本涵盖了模板中提到的要素。
提示:一只纸质熊猫平静地走过一片折纸竹林,电影感,可爱,柔焦,背景虚化。
并且,这次Adobe再次推出新功能,让Photoshop也全面升级。
Photoshop的智能去除功能,可以让我们清理照片中不需要的元素,比如背景中的路人,或者是突兀的电线。
它能检测并移除这些元素,然后用AI生成的内容无缝填补。
左:原图;右:天空中杂乱电线被AI移除,画面简洁清晰
当然,Photoshop中也融入了Adobe Firefly的AI功能,让我们可以对画面进行生成式填充和扩展。
AI功能由最新的Adobe Firefly图像模型驱动,可以为图像带来前所未有的真实感和逼真度。
具体来说,在细节、光线、构图和色彩方面,我们可以更精确地控制生成的图像。
此外,新增的「生成相似」功能,可以让我们得到更多样化的图像变体。
生成式填充
生成式拓展
生成相似内容
在Adobe Photoshop(测试版)中,还有一个新功能,就是生成式工作区。
其他AI图像生成器只能产生有限的结果,但工作区可以让我们同时构思多个创意概念,只需输入文本提示,就能快速生成一系列图像。
这样,就能方便地搜索和重复之前的文本提示和图像,生成一组图像的同时就能开始生成下一组。
文章来自于“新智元”,作者“编辑部”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0