在全球数字化转型的浪潮中,AI 为各行各业带来焕新活力。时光荏苒,电影行业也在拥抱新技术,欢迎新内容。
2024 年,是被业界称为 AI 视频元年的一年,也是恰逢金鸡电影创投大会自创办以来的第二个五年。
因此,为鼓励电影人拥抱 AI 大模型技术,发掘电影新人,打造更加富有创意与艺术价值的新影视作品,大会联合阿里通义、阿里影业共同发起了一个「AI 创造者计划」。
最后,共有四支 AIGC 视频样片入围主单元的终极路演。
让我们一起来看看!
《刀》以独特的水墨意境勾勒出一个充满江湖气息的武侠世界,里面的运动动作自然流畅、手指细节清晰、液体效果逼真。
若采用传统摄影或手绘动画来呈现水墨武侠的动态美感,将耗费海量人力物力。
但借助 AI,创作团队得以将激烈的打斗场景转化为精确的镜头分镜,不仅让动作衔接更加流畅自然,还通过通义万相的水墨风格渲染,完美还原创作者心中的江湖画卷。
《天线》讲述了一段跨越星际的奇遇:一个迷失人生方向的精神小伙王强,与倔强老人周火兴意外成为了 36.9 亿外星生命的“守护者”。
主创团队面临着巨大的创作挑战:神秘的外星生物“鼬”、浩瀚的“opal 星球”、壮观的宇宙飞船,这些都是前所未有的视觉创想。要将这些超越想象的元素搬上银幕并非易事。
但通过 AI 技术,最终成功地将这些天马行空的幻想转化为震撼人心的视觉盛宴,让观众得以一睹创作者脑海中那个奇幻宇宙的真实模样。
影片通过绚烂的宇宙环境和物体变换、不同年龄阶段的同一个角色,展现多种维度世界的遐想。
《同乡异客》巧妙运用 AI,将复杂的维度转换和空间变幻呈现为流畅优美的视觉效果。
在 AI 的助力下,晦涩的物理概念摇身一变!成为了直观生动的画面,让观众能够轻松理解并沉浸其中。
《三岔口》以一个令人意想不到的都市悬疑展开:一份看似普通的桂花糕外卖,却将三个素不相识的异乡人命运交织在一起,他们的纠葛与矛盾环环相扣,开场便设下扣人心弦的悬念陷阱。
影片制作中,打造多人剧情场景是对 AI 技术的一次重大考验。
创作团队需要攻克双重难关:既要确保每个角色的面部特征在故事推进中保持高度一致,又要让人物动作行云流水、自然写实。这种对细节的极致追求,让整部作品的视觉表现更臻完美。
这些影片将最后角逐「AI 创造者计划·荣誉项目」。
特工们有幸提前欣赏了这些佳作。不论是主体立意、剧本构思、画面美观、逻辑串联,都超出了我们对于 AI 视频的预期。
在本次“AI 创造者计划”中,通义模型帮助青年影人快速梳理剧本大纲、转绘手稿分镜、生成视频画面......
通义在剧本创作、角色设计、场景建构、后期制作等多个环节,助力电影人利用先进的 AI 大模型新技术,创作出更多充满想象力、创新性和艺术性新影视作品。
具体来说,通义模型在影视方面有以下几个技术亮点。
1. 多元创作能力。
2. 视频生成能力。
通义万相的视频生成模型,可生成影视级高清视频,可应用于影视创作、动画设计、广告设计等领域。模型具有文生视频、图生视频功能;在文生视频中,用户输入任意文字提示词,即可生成一段高清视频,支持中英文多语言输入,并可以通过灵感扩写功能智能丰富视频内容表现力,支持 16:9、9:16 等多种比例生成;在图生视频功能中,支持用户将任意图片转化为动态视频,按照上传的图像比例或预设比例进行生成,同时可以通过提示词控制视频运动。
3. 视觉生成与编辑能力 ACE(All-roundCreatorandEditor)。
ACE 是通义万相推出的全方位的「视觉生成与编辑」的模型能力。模型基于 Diffusion Transformer 架构,结合文本指令操作能力,通过高效的数据收集与微调技术,实现了在多种视觉生成任务中媲美专家模型的表现。ACE 具备视觉生成和编辑功能,支持文本引导生成、低级视觉分析、可控生成、元素编辑、重绘、图层编辑和参考生成等多项功能;通过引入上下文机制,模型还能够理解自然语言形式的编辑指令,包括「生成类」与「编辑类」指令,从而高效适应复杂的多模态生成和编辑任务。
4. 组图生成训练方法 IC-LoRA。
IC-LoRA(In-Context LoRA)是通义万相全新推出的面向「组图生成」场景的图像生成训练方法。该方法更好使用了 DiT 架构中文本到图像的上下文能力,对多张图像进行拼接并联合描述,从而在小样本数据集上微调即可让模型具备较好的上下文联合表现能力。使用 IC-LoRA 可以轻松实现有关联图像间的组合生成,并简单且高效的保持图像间的特征稳定连续,如场景空间、画面风格、主体形象、文字字形、品牌 logo 等类型特征,从而可以轻松生成一组有着紧密联系的图像,用于创作绘本、产品展示、视频分镜创作等业务应用。
从剧本构思到画面呈现,从视觉特效到成片制作,通义正以其强大的 AI 能力重新定义电影创作流程,成为新一代青年影人的得力助手。
在这个技术与艺术加速融合的时代,创作者们借助 AI 的创新力量,不仅大幅降低了试错成本,更打破了传统制作的桎梏:曾经需要耗费大量人力物力的特效制作,现在可以通过 AI 快速实现;那些仅存在想象中的奇幻场景,如今能够轻松具象化;就连复杂的多人剧情和动作戏,也能借助 AI 技术达到令人惊叹的效果。
无论是水墨武侠的飘逸动感,还是科幻题材的未来景观,抑或是现实主义题材中的细腻情感,AI 都能以惊人的效率和品质完美呈现。
更令人振奋的是,这种创作革新不再是少数人的专利。
最后,感兴趣的读者伙伴,可以点击阅读原文,去通义官网体验试一试创作效果。
说不定下一个爆款影片的作者就是你!
文章来自于微信公众号“特工宇宙”,作者“特工女巫”
【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。
项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0