你的朋友圈和社媒,过去一年里应该不止一次被图片生成模型刷屏:AI 吉卜力画风席卷社交平台,神秘香蕉引发全网狂欢,并因此获得了泼天且持久的流量。
与图片模型的勃勃生机形成鲜明对比的是,视频模型虽然时不时会出现惊艳爆款,威尔史密斯吃面也真假难辨了,但依旧还是极客的玩具。
a16z 合伙人 Olivia Moore 晒出的一组数据残酷指出:Sora 2 的 30 天用户留存率仅 1%,60 天留存率直接归零。

究其原因,大部分视频生成产品都在把工具做强,然后等用户自己探索用法。但生成一段炫酷视频很简单,但生成了之后呢?发给谁?为什么发?普通人什么时候会产生「我想生成一段视频」的冲动?
APPSO 观察了大量关于 AI 视频生成的比赛后也在想,除了用 AI 做影视或者广告片,还有没有更接地气的方式,让我们愿意像发朋友圈抖音一样来创作 AI 视频。
你还别说,最近我还真看到一个有点不一样的的 AI 创作比赛,国际奥委会联合阿里云搞了一场「米兰冬奥会 AIGC 全球大赛」,用万相大模型输入一句话,生成 5 到 15 秒冬奥视频即可参赛。不需要专业设备、不需要懂技术、甚至不需要会滑雪,只需要有个脑洞。



国际奥林匹克运动会官网截图
说实话我之前觉得体育和 AI 八竿子打不着,我要看的是真实的汗水和肌肉。
但试玩之后我有了不一样的感受。
这事儿之所以有意思,不在于它是又一个 AI 比赛,而在于它提供了一个绝佳的观察样本:
当最顶尖的生成式 AI,撞上对物理规则最较真、对视觉呈现最苛刻的百年奥运,会发生什么?
这不再是在 AI 圈的自嗨,随之而来的是一场面向全球数十亿人的「公测」。
冬奥会,一次对 AI 视频的「地狱级压测」
你可能会说,这么多体育赛事,为什么要
偏偏用冬奥会来做这个 AI 大赛?
如果你深入了解过视频生成技术的底层逻辑,就会发现这是一个极其「硬核」的选择。因为相比于其他项目,
冬奥会赛事天然是 AI 的克星。
目前的视频生成模型,最怕两件事:
高速运动的一致性和复杂的流体/粒子物理规律。
2022 年北京冬奥会上,18 岁的谷爱凌在自由式滑雪女子大跳台项目夺冠,那句「我不是想打败谁,我是想做到最好的自己」,连同她夺冠的瞬间一起,成为奥运史上的经典记忆。

短道速滑、雪车、空中技巧等项目,运动速度极快且动作幅度大,传统 AI 模型处理此类场景时,极易出现肢体扭曲、穿模或瞬移等物理错误。
而米兰冬奥会 AIGC 全球大赛将视频时长限定在 15 秒以内,这其实也是也是对万相大模型技术最苛刻的的「压力测试」,较长的视频时长可以通过叙事铺垫掩盖生成瑕疵,但在 15 秒的窗口内,几乎不存在缓冲空间。每一帧都暴露在放大镜下,容错率极低。
这意味着 AI 必须生成完全符合物理规律的视频,不仅要保证高速运动的连贯性,无卡顿、撕裂、鬼影,就连运动模糊都要贴合真实光学效果——这些要求对模型性能的考验,远比生成一段静态风景片段要残酷得多。

实际测试中,我让 Wan2.6 生成一张「大湾鸡滑雪」的图,再用 Wan2.6 转成视频,雪花飞溅的轨迹、身体摇摆的姿态,动态感和细节都超出了我的预期,几乎完全看不出是 AI 捏出来的。
「大湾鸡」能驰骋雪场,还有更多不同风格、不同主体的效果都能保持动作的连贯和一致性,梵高风、漫画风、科幻风、油画风,通通试了一下,全部都很惊艳!

从动态效果来看,这只小猫无论是毛发的质感还是滑行的动态,整体表现力都相当好的。

进一步拓宽风格边界,尝试更具张力的单板滑雪场景。看得出,画面中这位多彩小人,滑行重心极稳,起承转合间尽显「雪场老手」的游刃有余,并没有 AI 生成常见的漂浮感。

更关键的技术突破在于多模态参考生成能力。
万相 2.6 可以进行镜像级人物重建,能精准捕捉用户上传的形象特征。它能直接参考输入视频里的形象和声音来做二次创作,不管是人还是拟人形象都能当主角,多人合拍、人与物同框都没问题。

而且它还自带 AI 角色库,大圣、关羽、猫猫狗狗、体育生、潮酷女……全是耳熟能详的形象。我随手输了句「@ 大圣 从高空跳台滑雪起跳」,它直接基于大圣的形象,生成了连贯又符合逻辑的滑雪视频。
与此同时,万相 2.6 的智能多镜能力,还解决了主流视频生成模型的「单镜头限制」痛点,能够在一个生成任务中输出包含多个镜头的连贯视频流,再搭配原生音画同步能力,非专业用户也能轻松产出视听完整的作品。

再将难度升级到极具挑战性的第一人称视角,滑雪者手持运动相机高速俯冲,镜头在捕捉面部微表情的同时,还要兼顾右后方的伴滑者。在复杂的多主体动态场景下,画面居然也没崩。

当然,技术的成熟大幅降低了参赛门槛,绝不意味着竞争强度的削弱。
传统 AI 比赛往往需要编程基础、专业设备和大量时间投入,而此次大赛只需一句话提示词、一个浏览器和几分钟时间——当工具门槛被抹平,竞争的核心便从「技术能力」转向了「创意表达」。
当工具足够强大,便能将竞争的主动权交还给人类的想象力——这正是米兰冬奥会 AIGC 全球大赛的核心逻辑,也呼应了本届冬奥会「IT'S YOUR VIBE(意展你风采)」的核心主张。

让你的创意成为奥运故事,背后并不简单
AI 视频生成模型发展到现在,技术已经不是最大的问题。万相大模型能处理高速运动场景、能做多模态参考生成、能实现智能多镜,这些能力已经足够强大。
但强大的技术需要配套的基础设施才能真正落地。这是一个容易被忽视但至关重要的差异:纯模型厂商只能提供生成能力,但从用户输入提示词到最终作品展示,中间还有存储、渲染、分发等一系列环节。
阿里云将奥运级 AI 科技大规模应用于粉丝互动,本质上就是在建立一种全新的内容生产机制:
打破专业与大众的壁垒,让每个普通人的脑洞,都有机会成为百年奥运故事的一部分。
正如国际奥委会主席柯丝蒂·考文垂所说的:
「请持续创造、持续分享,让你的创意成为奥林匹克故事的一部分。」

而这场合作的价值,更在于提供了一个可复制的「高频+刚需」场景样本。
如开头所说,日常生活里,普通人鲜有必须生成视频的强需求,但奥运会期间,全球关注度集中爆发,粉丝有强烈的表达热情却缺乏便捷工具——传统应援方式要么成本高、要么门槛高,而 AI 生成的个性化内容不失为一个更好的选择。

而且用户行为数据也在验证这个方向。WSC Sports 发布的 2025-2026 世代粉丝研究报告显示,Z 世代与千禧一代不再依赖线性电视直播,而是在社交媒体上消费短视频、高光集锦与互动二创,忠诚度追随「相关性」而非「内容可得性」。
这意味着传播逻辑结构正在改变:
观众从内容消费的终点,变成内容生产的源头。
参赛作品可自由传播,不受版权限制。你可以让大湾鸡成为主角,也能让奶油蛋糕变成赛道。

比赛参加方式
现在上奥林匹克官网(olympics.com)的「连结,竞技,共庆」专区,或者直接从阿里云官网进赛事页面就行。选花样滑冰、短道速滑、高山滑雪、单板滑雪里任意一个经典动作当模板,输一句带自己创意的提示词,就能完成专属的奥运艺术作品。
阿里的 AI 产品生态都为这次大赛留足空间,无论是开源开放的开发者社区 Modelscope、还是 AI 创作工具通义万相、堆友,都参与到了这次大赛当中来。
而且更令人我惊喜的是,这次比赛优秀作品还将被送进奥林匹克博物馆,和奥运历史藏品并排陈列,为百年奥运精神在 AI 时代添加新的注脚。

比起教育用户,当创作有了动机、作品有了去处,把合适的工具递到用户手里,视频模型也距离它的「登月」时刻更近一步。
AI 终于把百年奥运「开源」了,我们不再是观众
回望过去,每一次媒介技术的变革,都会重塑我们参与世界的方式。
如果说摄影技术让我们拥有了记录的权利,电视转播让我们拥有了在场的权利,那么 AI 带来的,是「想象力的平权」。
用 AI 圈的话来说,奥运会百年来首次「开源」了。
米兰冬奥会 AIGC 全球大赛,实际上是给全球数十亿人发了一张「全民外卡」,把「观看」变成「创造」。它不再要求你有过人的体能,也不要求你有精湛的技艺。它只要求你有一颗不甘平庸的大脑,和一种想要表达的冲动。

这是奥运史上第一次,用 AI 把「参与权」真正还给普通人。第一次
,想象力和创造力获得了与竞技成绩同等的文化地位;第一次,普通人的作品甚至有可能比运动员的比赛更出圈。
它传递了一个非常隐晦但精准的信号:
AI 不应该只是极客的玩具,它应该属于每一个人(AI for all)。
当技术足够先进时,它就应该像自来水一样,拧开龙头就能用。我们不需要去崇拜技术本身,而是要利用技术去释放内心的创造力。
在这个赛场上,没有裁判,没有犯规,只有想象力的无尽驰骋。你可以让长城变成滑雪道,你可以让兵马俑穿上冰刀,你可以和谷爱凌一样在赛场滑翔。
所以说,米兰冬奥会 AIGC 全球大赛的价值不只在于产生了多少作品或有多少人参与,更在于它验证了一个此前从未在顶级 IP 上被验证过的商业假设。
传统体育 IP 的价值,依赖于稀缺性(四年一届、顶级运动员有限)、不可预测性(比赛结果未知)与情感联结(国家荣誉、偶像崇拜)三大支柱,但在互联网时代,这三大支柱均遭侵蚀。
现如今,AI 将有望成为体育 IP 的第四支柱。
它的核心逻辑是把 IP 从看完即止的快消品,变成了可供二创的「生产资料」。与其花钱买流量,不如把创作权交出去,让每一个用户都变成自带干粮的免费渠道。
这种模式很可能将成为所有超级 IP 的标配。它将被无数次地复制、迭代,从体育赛事蔓延至人类文化的每一个角落,直到最终成为所有大型盛会拥抱 AI 时代的通用入场券。
试想一下,世界杯球迷或许能一键生成自己捧杯的荣耀时刻,NBA 观众能让自己「置身」赛场完成绝杀,甚至延伸到娱乐与文化领域——演唱会粉丝能生成与偶像同台的片段,博物馆游客能「穿越」到历史场景,非遗传承人可借助 AI 演示技艺。
这或许才是在 AI 时代,对奥林匹克精神新的诠释:
不仅更快、更高、更强、更团结,还有「更敢想、更敢秀」。
文章来自于微信公众号 “APPSO”,作者 “APPSO”
【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。
项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file
在线使用:https://aicomicfactory.app/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales