这两天正值釜山电影节。
我一个 AI 圈的,为啥会关注到电影圈呢?倒不是因为我爱看电影,而是因为电影节的放映单元,突然冒出来了我们圈子里几个“老熟人”:Seedream(图像创作模型)、Seedance(视频生成模型)、即梦 AI。
平时这些模型在我们这儿是拿来生图、跑视频、玩效果图的,现在居然进电影节展映了。
就在昨天,第 30 届釜山国际电影节 InnoAsia 平台上,一场名为“未来影像”的 AI 电影国际峰会正式开场。
这场活动由即梦 AI、火山引擎和上海电影联合主办,5 部由 AI 主导生成的短片在国际电影节现场公开展映。
更魔幻的还得是评委席的组合。
有社会学家李银河,这位写过《爱你就像爱生命》、研究了一辈子人类情感的学者,现在要判断 AI 懂不懂什么叫"爱"。
有韩国导演金泰勇,如果你看过《晚秋》,就知道这位导演有多会拍情感戏——汤唯和玄彬在西雅图的那场邂逅,至今是我心中的爱情经典之一。现在他要评判的是,AI 能不能拍出那种微妙的情感张力。
还有摄影指导夏永康。这位给王家卫、陈可辛掌镜的摄影大师,拍出过《春光乍泄》里梁朝伟抽烟的经典镜头。现在他盯着屏幕,可能在想:AI 懂什么叫「镜头语言」吗?
还有火山引擎、即梦团队的人,搞 AI 的和搞电影的这两拨人撞一起了。这个场面可太有冲击力了!
人文学者、艺术家、技术专家,第一次为了同一件事聚在一起——AI 和电影。
这五部作品都是以即梦等 AI 工具为主要创作工具。说实话,除了最前面的第一部作品《九霄》,其他 4 部作品,如果不告诉我这是 AI 做的,我都想不到竟然是 AI 完成的。
我挑两个让我印象最深的镜头来说说:
第一个是《法体 Beopche》的寺庙长镜头,从佛塔缓缓扫过僧人的背影,落到主角脸上,光线、虚实、动作、情绪全部在线,人物的微表情甚至比真人演员还稳定。
第二个是《权利童话》的转场设计。一个红苹果从树上落下,穿过不同的时空——春天的花园、夏天的草地、秋天的落叶、冬天的雪地。每次穿越,苹果的状态都在变化:从新鲜到腐烂,又重新变得鲜红。
这不是简单的特效,已经可以叫做「AI 的镜头思维」,焦点切换、景深变化、运动控制,都不是随机的,而是有意识的构建。
看这些镜头时,我觉得,AI 正在逐渐拥有自己的电影语言。
人类会受限于物理世界,比如演员会疲惫,场景得搭建,但 AI 没有这些限制,它可以让镜头穿越时空,甚至可以让光线违背物理定律,创造出人类拍不出来的画面。
这种“不受限”反而成了 AI 电影的独特美学,就像动画片也不需要模仿真人电影一样。
你们知不知道去年抖音上有一部很火的 AI 短剧——《三星堆·未来启示录》,播放量排在抖音短剧的排行榜第二名。
这是博纳影业第一次与即梦和抖音合作,用 AI 生成整部影视内容,“拍”出他们的首部 AIGC 短剧。
在现场,博纳影业集团影视制作副总经理曲吉小江讲了一个细节——
2024 年初决定用 AI“拍”《三星堆:未来启示录》第一季时,数字人连嘴都张不开。第二季《三星堆:未来往事》(电影版)都蓄势待发准备要上院线了。
两年,AI 从“张不开嘴”到上院线。这个速度连博纳也没想到。
曲吉小江提出了两个有意思的概念:现在电影行业里有两种用 AI 的方式。
第一种是「AI+」,以 AI 为核心技术,人机共创。
博纳第一季《三星堆》就是这种模式。2024 年初,他们用 13 集 AI 科幻短剧的方式在抖音试水。
“那时候 AI 技术还在探索阶段,我们更多是在用影视的叙事探索技术的天花板。”
曲吉小江是这么说的。了解 AIGC 的小伙伴都非常清楚,生成符合真实世界物理规律的图一直是 AI 生图的卡点,比如三千年前古蜀国的地理环境、人物服饰、青铜面具纹路、文物细节、生产生活的状态等,每一样对 AI 来说都是挑战,所以三星堆这个题材特别困难。
但是博纳赌对了方向。
第二种是「+AI」,在电影工业化基础上,让 AI 融入整条创意与制作流程,但是 AI 又消遁无形,让人看不出来 AI 了。
这就是第二季《三星堆:未来往事》大电影的路子。《三星堆》大电影是中国首部 AI 原生电影,憋足了劲儿准备要上院线的那种。
从短剧到大银幕,这个跨越有多大?曲吉小江的一句话说得很清楚:“精准和可控是电影导演的终极追求,一切都要在工业化体系里得到呈现,丝毫不能差。”
所以这意味着,AI 生成的每一帧都要经得起大银幕的考验。观众会用真人电影的标准来要求你——人物质感要真实细腻,要符合物理世界定律,光影要自然,表情要稳定。
所以博纳把能想到的、能找到的、能用到的国内外模型都试了一轮,经过对比评估后,第二季大幅转向使用火山引擎的底层模型。
这一点,和我的感知也是吻合的,自从 2024 年 2 月 Sora 发布之后,之后除了全面开放那一次,好像没有突破的更新,所以 2024 年下半年以后基本都是中国国产的模型在迭代,Seedance、Seedream 也是其中一股力量。
Seedream 4.0 解决了电影最核心的问题:图像质量。如果想做电影,用文生视频是做不到的,必须用图生视频。4.0 有一个多图参考功能,可以在一幅画面中组合所需要的多种元素,而且每一个细节可控。
三星堆文明里青铜面具、古蜀祭祀、蜀国地理环境、人物服饰,这些写实的图片,AI 的完成度已经很高了。
Seedance 1.0 Pro 则支持长镜头调度、多主体动作、场景切换和节奏控制,让模型生成的片段具备完整电影语言。
过去,电影是「重工业」——高投资、长周期、赢者通吃。博纳的《三星堆》如果按传统方式拍,投资要几个亿。
现在呢?无中生有。什么叫无中生有?
只靠一台电脑、一些模型,还有你作为导演的思想表达。
而且,所有为影片生成的内容都会沉淀为数字资产,这些资产可以留存、迁移、重组、衍生、复用。
还有赵汗青的汗青工作室,大家应该都看过他的作品——AI 原生歌手 Yuri 尤栗。"过去做一个 MV 需要整个专业团队,现在几个人就能完成。"
为什么越来愈多创作者敢投入到 AI 电影?
因为技术的门槛降低到个人可以承受的程度。
大家都知道,前段时间 nano-banana 大火,引爆了图生视频圈,而火山引擎、即梦 AI 最近上新的 Seedream 4.0 也能实现类似功能,甚至在部分场景上更有优势。
Seedream 4.0 解决了一个老大难问题:图片风格的稳定性和多图融合。
以前你要生成角色,一会儿脸变、一会儿衣服花,生成十张能用两张就不错。现在,它能在多个参考图之间做出结构统一的融合构图,画面细节能打上光影、材质、动作这些更电影感的元素。
曲吉小江提到:“你如果想拍电影,肯定不能靠文生视频,图生视频才是正路。而图的质量,决定了你最终画面能走多远。”
还有一个关键问题:可以生成 4K 画质。
好多不了解电影的人可能不知道,4K 不是噱头,是能上大银幕的及格线。以前 AI 生成的画面,放到大屏上瑕疵就暴露了。现在不会了。
而图做稳了,视频就得跟上。火山引擎今年新推的 Seedance 1.0 Pro,是他们第一次敢拿来跑电影长镜头的模型。从多镜头组合、角色运动到场景切换,都能做到连贯流畅。
最核心的点是:人物不会崩。表情、动作、五官细节,都可以从镜头头尾稳定延续,这种一致性,在视频 AI 这块曾经是最大痛点。
博纳能有底气把《三星堆》第二季搬上大银幕,很大程度上是因为这些模型能力终于能"压住场子"了。曲吉小江透露:
从第一季的部分使用国产模型,到现在大部分都用火山引擎的底层模型。国产大模型在全球已经处于领先位置。
有了模型技术的底层能力还不完全够,还得有趁手的创作工具。那么就是即梦了。
"即梦最大的特点是生态级。"赵汗青说,"上面有生图、视频、数字人技术,甚至通过 Agent 能解决脚本、文本、剪辑问题。它把火山的工业级交付能力,在用户体验层面做了全平台整合。"
这次"未来影像计划"的要求很明确:必须用 AI 工具创作,且必须包括即梦 AI。
8 月 15 日发起征集,9 月 22 日展映,一个多月时间,5 部作品就达到了能在电影节放映的标准。这放在以前,不可能。
回到开头的场景,李银河说了一句话:
技术的进步为我们打开了新的表达空间。在这个人人皆可创作的时代,那些能够深入生活、敏感地捕捉情感、自由地表达自我的创作者,将用他们的作品为这个时代留下独一无二的影像记忆。
这句话点出来了本质,AI 解决的是生产力问题,但内容的核心永远是人的表达。
问题不是"AI 会不会取代导演",而是——你准备好成为 AI 时代的导演了吗?
AI 不是替代谁,而是放大谁。
当技术不再是障碍,创作的核心回归到了最本质的问题:你想说什么,以及怎么说。
2007 年乔布斯发布第一代 iPhone 时说的那句话:"今天,我们重新发明了电话。"当时很多人觉得他在吹牛,诺基亚的高管甚至嘲笑 iPhone 没有键盘。但我们都知道后来发生了什么。
现在,AI 也正在重新发明电影。
不是 10 年后,不是 5 年后,就是现在。
文章来自于微信公众号 “夕小瑶科技说”,作者 “夕小瑶科技说”
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales