深度|AI互动内容的分水岭时刻,AI娱乐应用贝果要搞一场万人直播挑战极限

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
深度|AI互动内容的分水岭时刻,AI娱乐应用贝果要搞一场万人直播挑战极限
9278点击    2026-05-22 15:46

深度|AI互动内容的分水岭时刻,这家公司要搞一场万人直播挑战极限


01 用AI重新定义“人与人的连接”


李诞带火了一个AI娱乐应用贝果,带着好奇,我第一时间通过内部朋友要到了内测资格。


最上头的是贝果的“现实 Online”这个产品。它的玩法听上去极其简单:拿起手机,随手一扫,但就在这短短几秒钟里,整个办公室瞬间就被改造成了一个可以实时探索的游戏空间。


其中一个解密关卡,系统要求我根据黑板上几只小动物的叫声次数推测密码,而且只有两次机会。我脑子先是空白了两秒,然后开始疯狂回忆:“第一个叫了两声……第三个好像也是两声……中间那个是不是五声?”


最后硬着头皮输对密码的一瞬间,我突然意识到,已经很久没有哪款互联网产品,让我进入这种高度专注、甚至有点忘我的状态了。那不是简单的好玩。而是一种极其久违的心流体验。


这种沉浸感夸张到什么程度?在体验中途,贝果的创始人球球(Qiuqiu)走到我身边打了好几次招呼,我竟然完全没有注意到。


这真的是一个全新的AI native互动产品——不是能直接生成内容,而是它开始接管并创造人与人之间关系发生的“场”,背后其实藏着当下最难的一套实时互动技术系统,一旦做大,市场空间无法想象,因为它是与我们每个人都能发生关联。


贝果照见了AI互动内容平台的三个核心:


  • 不是单人对话,而是多人开放场景;
  • 不是生成内容,而是边理解、边调度、边生成;
  • 不是预设的内容,是实时的体验。


贝果创始人球球还向我透露了一个更“疯狂”的计划——他们将在6月直接在抖音与知名游戏博主六六开启一场万人直播间直播。不是简单的 AI 连麦,也不是传统直播间玩法,而是真正把多人实时互动、AI 场控、内容生成全部同时推向线上真实流量环境。


深度|AI互动内容的分水岭时刻,这家公司要搞一场万人直播挑战极限


我问她:“这么有信心吗?”她笑着调侃。“要是丢人,就丢个大的。”


但说实话,听到这里的时候,我脑子里的第一反应,其实已经不是“这个产品好不好玩”。而是这群人不是在做一个AI功能,而是在赌一个时代入口。他们选了最难的题,把自己推上了牌桌,不是在讲ppt故事,而是敢在真实流量面前做一场无法预知后果的大型压力测试。


更重要的是,在这场万人互动里,每个人也不再只是围观者,而是真正能够进入内容本身的人。你的互动、接话、情绪反馈,甚至现场每一次参与,都可能实时改变接下来会发生什么。6月大家都可以去贝果官方账号节目单预约这场大型互动秀。


02 一线基金为何抢先下注这家AI创业公司?


我们也了解到,打造贝果的AI创业公司大千已经完成多轮融资,股东包括蓝驰创投、创新工场、明势资本、江远投资、光合创投等一线投资机构,创新工场和明势资本多次加注,蓝驰创投更是每轮都押。这不是讲故事,是真金白银的连续重注。


为什么是一线基金先下注?他们到底看中了大千的什么?


答案绝对不是所谓的单个AI产品爆款,而是一个底层引擎,以及下一代流量入口级机会。


大模型时代,做 AI 陪伴、AI 聊天、AI 工具的人很多,比如各种AI分身、虚拟恋人,新鲜感很容易过头,难真正沉淀长期留存。大多集中在三类事:提效、陪伴、生成。这些方向当然都重要,也都跑出了自己的阶段性成果。但如果把时间拉长一点看,它们共同指向的,本质还是内容生产效率的问题。


更大的机会,也许在另一件事上:AI不只是生产内容,而是开始实时组织人的参与,制造一个可以让内容自然发生的“场”。


贝果可能是最早逼近这件事的产品之一:他们选择把AI打造成底层的引擎系统,做多人实时互动内容。


单拆开看,多人、实时、互动这三个能力好像每个都能找到对应的产品,但是把这三个作为原子能力组合在一起做的,几乎没有,不是因为没有人想到,而是因为太难。一旦进入多人实时互动,AI 面对的就不再只是生成内容这么简单,还需要同时理解多人状态、处理语音与情绪节奏、维持叙事推进、调度互动关系,甚至控制整个场的氛围感。这些不仅是产品问题,


这背后,真正困难的地方在于如何打造一个实时流式交互模型,这才是整套体验真正的底层引擎——它需要做到逐帧预测、逐帧播放,并且能够被用户实时互动信号持续驱动。在运行机制上它与视频生成模型有着本质的区别,工作流也截然不同。已经不仅是产品问题,更是底层技术上的系统工程难题。


但一旦把多人互动、实时调度、实时反馈这三个能力组合起来,构建一个多人实时互动内容引擎,面临的机会巨大,甚至可以迁移到直播、游戏、综艺、社交、短剧等多场景,作为新的内容基础设施引擎支撑新一代的内容生态的构建。


图文时代的入口是分发,短视频时代的入口是算法,AI native时代,入口可能变成实时互动引擎。谁先掌握这种引擎,谁就更有机会拿到 AI 内容行业下一个阶段真正的平台型入口。


拆开来看,这套实时互动引擎,本质在于AI内容行业的叙事中心正从“生成内容”转向“组织参与”。


互联网诞生以来,我们一直是被动的内容消费者。最早的论坛时代,用户只是“看内容”;短视频时代,平台开始通过算法对内容的生产和消费进行了再分发,用户依旧还是被动的看;直播时代,用户进一步拥有了弹幕、连麦、打赏等互动能力,用户角色越来越重,但本质上依然属于一种有限参与,可以评论、可以刷礼物、可以发弹幕,但整体上仍是围观者,是被动接收者。而今天,很多 AI 产品其实也还停留在这套逻辑里:AI负责生成和分发,用户负责观看,只在效率上进行了改进。


但如果再往前推一步,更大的变化不在于“AI会不会生成”,而在于:AI能不能让内容不再只是被生产和分发,而是在用户的参与过程中被实时组织出来——内容不再是“主播表演、观众观看”的独角戏,而是一个所有人都在实时参与、共同推进的 AI 互动世界。AI 在里面承担的角色,也不再只是内容生成工具,而更像一个实时运转的“互动引擎”——负责制造情境、调度节奏、推动冲突、强化反馈,再不断把用户拉进内容内部。


就像我玩贝果的“百变大咖”一样,可以让我一个“i人”在实时连线的剧本中卸下防备、大开脑洞地高频输出。一个我现在都记忆犹新的画面是,有个环节AI 让我扮演一只“大眼睛的贝果”。我本来还端着,结果另外几个人张嘴就开始脑洞大开,整个过程特别像:一个 AI 导演正在后台疯狂控场,而四个真人玩家被不断推着往更抽象的方向走。


深度|AI互动内容的分水岭时刻,AI娱乐应用贝果要搞一场万人直播挑战极限


AI 在这里不再是“社交对象”,而更像一种润物细无声的“场”。它负责把陌生人之间原本难以发生的互动,变成一个不断被情绪驱动的内容现场;负责降低尴尬感,制造参与感,再把真正的互动重新还给人。“我们是想让AI把人原本的魅力放大,让人们之间的互动更轻松好玩。”球球告诉我。


某种程度上,这甚至不是在“做社交”,而是在重新激活社交。AI开始真正触碰内容行业最核心、也最昂贵的部分:如何让一群人进入同一个节奏,并持续留在那个节奏里。


这不是一个新鲜的玩法,而是今天AI应用里最难的一道系统题。


03  从观众到局中人,贝果用AI重新定义互联网产品的竞争锚点


真正让我意识到这家公司不一样的,不是那些容易被概括成“有趣”“新鲜”的产品表象,而是我在体验它们时,明显感受到了一件过去很少发生的事:当我走近AI创造的这个“场”内,那种前所未有的沉浸式体验。


这种感受在贝果的“现实 Online”产品里尤其明显。系统会把现实空间重构成一个可探索的任务场,把原本稀松平常的现实物件重新赋予身份和作用手机镜头对准打印机,它突然变成了一个会提供线索的 NPC。微波炉变成了封印捣蛋鬼的“魔法空间”。黑板上的猫咪和任务图片,不仅会动,甚至还会突然开始说话、发出叫声。整个过程特别像真人版 AI 密室逃脱。


这种体验最厉害的地方,不是所谓的视觉效果和交互设计这些玩法层面的创新,而是它会让你很清楚地感觉到:你还站在现实里,但你的注意力已经被另一套叙事系统接管了。这种感觉让我想起了有时候沉迷刷短视频无法自拔的那种上瘾状态。


但和我们刷视频这种感受不同,在贝果创造的场内,有点像你身处另一个空间,随着剧情的变化心情跌宕起伏的时候,它已经悄然接管了你的注意力,这不就是互联网产品最本质的竞争锚点吗!


传统意义上的内容消费,本质上只能占用用户注意力;但真正高浓度的参与感,会直接把人拖进心流状态——忘记时间、忘记自我、完全沉浸。而这,恰恰是内容产品最核心的竞争力。换句话说,谁能让用户从“围观者”变成“局中人”,谁就能在下一个内容时代建立真正的壁垒。


这件事为什么难?从技术视角来看,AI的体验,一旦从“单人体验”进入“实时多人开放场景”,烧的token数量会骤然上升,技术难度也会直接指数级上升。


过去的大模型,大部分擅长的其实还是“一问一答”。哪怕是 Agent,也是在有限上下文里完成一个明确任务。


但贝果正在做的,完全不是这个难度级别。它面对的不是一个用户,而是一个持续变化、实时流动的多人互动环境。AI 需要同时处理多人语音输入、角色状态、空间信息、剧情推进、情绪反馈,以及人与人之间不断变化的互动关系。


大模型还要持续维护一个动态更新的“世界状态(World State)”:谁当前处于什么角色;剧情推进到哪一步;哪些用户正在主导互动;空间里哪些物体已经被触发;哪些任务链已经完成。这些变量并不是静态存在的,而是在每一秒都动态变化。


AI系统必须边发生、边理解、边生成。它既要做内容生成,又要做状态调度;既要维持叙事连续性,又要控制多人互动节奏。从工程意义上说,这已经不再像一个单点应用,而更接近一个实时运转的分布式控制系统。


这类系统里最残酷的一点在于:它还不能卡、不能慢。在普通chatbot产品里,延迟意味着体验变差;很多Agent的延迟或者任务失败最多推倒重来,但在多人实时互动场景里,延迟不是“体验问题”,而是产品是否成立的致命问题,一旦有延迟,沉浸感就断了,后续所有的体验都会坍塌。


对于大千而言,他们真正面对的,从来不是“AI 能不能生成内容”这道题,而是:能不能在一个持续变化、多人实时参与的群体场景里,稳定维持住一个高密度的内容现场。


这并不是一个靠灵感就能快速复制的创意,更像是一种复杂的系统能力。它背后需要工程能力、产品机制、内容理解、实时反馈调度,以及海量场景数据的长期打磨共同支撑。而系统能力一旦建立,商业壁垒也随之而生,且会越来越厚。


04 “我们爱人,也相信AI爱人”


在今天的内容消费坐标系里,贝果已经与传统的“上滑下滑”式小游戏、微短剧平台拉开了代际差。后者本质上仍是“工业化内容生产 + 算法再分发”,用户看似在不断滑动、点击、选择,但由于他们消费的每一分钟,都是由人工或半自动化工具提前堆砌出来的“确定性成品”,这导致此类产品在底层逻辑上很难做到“真正的个性化”,就难以满足用户日益变化的需求。


同时,它也不同于市面上大量“一对一”的 Chatbot 衍生产品。很多应用本质上是将传统的游戏做了一层大模型的壳。它不仅极度依赖用户的自驱力去创造对话,且缺乏人与人之间由于不确定性而碰撞出的群体网络效应。


贝果跳出了这两类传统形态,构建起一套“多人实时互动的AI内容引擎”。除了工程经验与技术产品的积累,更核心的价值在于它沉淀出了一种更具壁垒的能力资产。


今天的AI创业潮中,概念最易被高估,系统能力却容易被低估。因为概念可以迅速被复制,玩法可以迅速被跟进,产品壳子甚至可以在很短时间内被模仿得七七八八。但一套在真实用户、真实节奏、真实群体互动中跑出来的实时内容组织能力,绝不可能靠纯模仿就能短期内弯道超车。


这也是为什么我会觉得,大千更像一家“引擎型公司”,而不是一家普通的内容应用公司。


一旦产品体验形成闭环,飞轮就会自然开始转动:体验越好,用户越多;用户越多,互动内容和数据越丰富;而数据越丰富,AI 对“怎么玩才好玩”的理解也会越来越强,进而再吸引更多用户进入系统。那些持续积累下来的创作者表达、用户行为,以及互动过程中沉淀的内容数据,最终都会变成这家公司最核心的资产,护城河也会随之越挖越深。


AI 行业已经很久没有出现过让人“心跳加速”的产品了。


贝果之所以能在整个行业都在高喊“AI 应用落地难”的周期里脱颖而出,核心原因在于,他们把最前沿的 AI 多模态实时生成能力,与极其深刻的泛娱乐内容理解,真正缝合在了一起。


而这个产品背后,其实也是一群非常懂产品、懂内容、也懂用户的人。创始人球球是一位94年创业者,已经连续创业十多年,在移动互联网与内容行业都有极强的一线作战经验。团队里的技术、产品负责人同样履历扎实,核心成员来自前前字节游戏早期团队负责人、前 MiniMax 研发负责人、腾讯算法 tech lead,以及豆包早期核心模型产品团队成员等。


某种程度上,这是一批真正做过核心业务、打过硬仗的人。他们没有把 AI 当成一个冰冷的、只提升 10% 效率的生产力工具,而是试图把 AI 变成一种能够重新激活人与人关系的“多维介质”。


“任何足够先进的技术,初看都与魔法无异。”克拉克的这句话,在体验完贝果之后,突然从我脑海里冒了出来。


体验完回家的路上,我有些恍惚,突然想起很多年前第一次看《黑客帝国》时,那个经典的“红蓝药丸”选择。那时候的我几乎不会犹豫,一定会选红药丸。


很多年后再回头看,我忽然意识到,也许今天的 AI,正在把那个问题重新摆到所有人面前。区别在于,这一次,它不再只是关于虚拟世界的幻想,而是一个已经开始发生的现实。


而贝果,显然已经做出了自己的选择。“之所以这么做,是因为我们爱人,也相信 AI 爱人。”球球这样解释他们的初心。


至于属于我们的答案,或许才刚刚开始


文章来自于微信公众号 “Z Potentials”,作者 “Z Potentials”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales