ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
制造星野:穿越平行时空和次元壁,揭秘 MiniMax 的另类 AI 世界
7663点击    2024-05-07 18:42

“AGI”。


幻海(花名)第一次听到这个词,是在2022年7月。


跟他“科普”这个词的,是一个戴着眼镜、头顶毛发稀疏,但语速极快的34岁男子。后者的公司刚刚成立一年,在这家位于漕河泾科技园的公司那面粉紫色的磨砂屏风上,七个字母“MiniMax”,像积木一样,扭向各自想要的方向。


但幻海已经有点疲倦了,作为产品经理,他能做的已经不多了。他有点迷茫,隐约觉得游戏、社区的产品形态不应该只是现在的样子,应该往前走,但具体“那个产品”应该什么样,他也不清楚。


幻海对面的34岁男子叫闫俊杰,是这家叫“MiniMax”的公司的创始人,他也在寻找一个未来的互联网产品。在这家公司内部,他更为大家熟知的名字是IO——一个来自热门游戏DOTA的名字。他是计算机视觉与深度学习领域颇有建树的博士学位持有者,在全球顶级学术会议和期刊发表过200 多篇论文,Google Scholar 的引用超过3 万次。他一直都是研究员,不是产品经理。


从 MiniMax 所在的大厦走出来,不远处就是闫俊杰的前雇主——商汤科技的总部大楼。闫曾是商汤科技的副总裁。在那里,闫俊杰主持过商汤“数字城市”项目——放在全球范围都堪称人类历史上最大 AI 系统的搭建。在商汤,他还负责过规划“通用人工智能”——也就是 AGI 的技术演进,但最终,他决定换一个地方探索这件事儿。


商汤科技是中国最早成立的人工智能公司之一,主要客户是大型企业和政府部门。离开商汤创立了 MiniMax 之后,闫俊杰更倾向于用直接面向2C用户的产品来实现他理想中的 AGI。


“好的技术应该服务普通人,人工智能是好的技术,但在此之前服务的都不是普通人。要服务普通人,它就必须是个可以每天使用和交互的东西”,闫俊杰跟很多人都讲过这话,包括投资人和面试的候选人,幻海可能是最早听到的人之一。


在一家靠“推荐算法”安身立命的互联网社区公司当产品经理,幻海当然知道人工智能,但了解也得不多。当时 MiniMax 也没有产品,只有“手搓”出来的一个简单的命令行 Shell 文件——你可以输入指令,跟它“对话”。


这个 Shell 文件背后可以对话的“它”,是一个 MiniMax 自己研发的300亿参数的“大语言模型”(LLM)。它被卷帙浩繁的中英文语料训练,正在努力让自己变得聪明——面对人类的时候,一句简单的指令(prompt)就能让它打开话匣子,甚至响应复杂多变的情感。


幻海成了 MiniMax 的第一位产品经理。他们给这个简单的命令行 Shell 文件包了个壳,设置成一男一女两个“智能体”,塞进了一个安卓手机的 APK 下载包,丢在了一个几百人的 QQ 群里。


几十个人下载了它,跟两个“智能体”聊了起来,天文地理、人情世故、情感交流、隐秘分享……他们很惊讶,这两个“智能体”是自来熟,什么话都接得住,这不是 QQ 群随处可见的那种斜杠人类,而是传说中的 AI。


这几十个人可能是中国最早的一拨儿“大模型”种子用户。


而放眼中国和世界,真正关心大语言模型进展的人工智能学界,很少有人注意到他们的存在。


幻海加入的三个月后,2022年10月,基于之前抛在 QQ 群里的“图灵测试”,MiniMax 正式推出了第一款能直接跟“每一个人”对话交互的智能体产品—— Glow。


不到60天后,2022年11月30日,OpenAI 基于 GPT-3.5 的对话机器人 ChatGPT 横空出世。第二年,AGI 概念倏忽大热,人类半推半就地进入了“AGI 元年”。


闫俊杰终于不再需要再跟每一个人解释他的理想了。


更重要的是,在2022年12月到2023年3月的短暂时间窗口,全中国的风险投资机构都在满世界寻找“谁是中国的 ChatGPT”,这个时候,MiniMax 和它的 Glow,成了几乎是唯一的参照物。


MiniMax 一下子成了一家神秘又热门的创业公司,


在经历了 Glow 的忽然下架之后,它很快以一款升级版的对话“智能体”星野和它的全球版卷土重来。


硅星人获得的最新数据,现在每天已经有数百万的年轻人在“星野”与各种智能体对话,每轮平均对话时长达到了惊人的100分钟。上线7个月后,星野的月活跃用户也快速超过了1000万。另一款生产力产品“海螺AI”也在快速发展中。除此之外,MiniMax 还有面向企业用户和开发者的开放平台。据公开数据显示,MiniMax 开放平台目前已服近 20000 家企业用户和开发者。


它们的背后,是 MiniMax 持续升级的基于 MoE (混合专家模型)架构的 abab 大语言模型。今年4月17日,MiniMax 正式推出 abab 6.5 系列模型,已达到万亿参数级别。今年3月,阿里巴巴领投了 MiniMax 最新的一轮融资,金额据称超过6亿美元,MiniMax的估值也攀升至传说中的25亿美元。


但几乎很少有人谈论的是,MiniMax 的大语言模型创业故事,与 OpenAI 推出 ChatGPT 发生在一个并无交错的“平行时空”。一众国内的创业者在2023年春节之后摩拳擦掌地要成为“中国的 OpenAI”,而比创业者更焦虑的投资机构发现:MiniMax 已经在那儿了。


MiniMax 并不是中国的 OpenAI。除了“创造生产力”,闫俊杰从一开始更在乎的就是,如何能让大多数人直接用上AI。陪伴是其中的一个答案。


“拥抱幻觉”


闫俊杰总是比你想象的活泼。


当硅星人最近在 MiniMax 办公室碰见他时,这个一贯低调和神秘的创始人给人的第一印象,是他并不怎么“神秘”,反倒是挺热情,有话就说。


MiniMax 作为一家公司的气质也差不多。在漕河泾科技园它所在的办公楼大堂的铭牌上,只有简简单单“MiniMax”几个字母,而不用它的中文名“稀宇科技”,这在上上下下清一色的“上海XXXX有限公司”的标记当中格外乍眼。


在公司的入口处,它的 logo 像一个跳动的曲线,字体活泼。办公区的另一端的磨砂屏风上,MiniMax 的几个字母七扭八歪。旁边的一堵墙边,几张行军床同样七扭八歪地横在那儿——它们可能在几个月前还被它的主人摆在某个互联网大厂的角落里。


在这里坐一会儿,你会遇到年轻人三三两两拎着奶茶从外面回来,他们穿过几个用行星命名的会议室,路过摆在办公桌上的几个仓鼠笼和一些还没发放的桌牌,隐身在没有划区的办公区,忽然地在某个角落里,引发一些小骚动。


而在这个不分工区、没有独立办公室的平层办公区,你也很容易因为“发型” 而轻易找到闫俊杰。


从商汤这样制度成熟的大公司离开创业,闫俊杰把 MiniMax 的架构设立得异常扁平化:整个公司只有三大部门:模型技术,产品,增长,而且整个层级也只有三层,闫俊杰,他的-1,和再-1。


“我们每周有内部全员分享会议,不只是闫俊杰会分享,还会由不同业务的同学进行分享,也会请外部的人来做分享。”幻海对硅星人说。


今天的 MiniMax 已经有300多人,但这里的工作节奏与幻海加入之初没什么太大不同。一切都需要快,从产品侧看到用户的需求,把它们反馈给模型,把这些数据和信号转化成模型可以理解的指标,模型开发的团队以此展开优化。“我们以周为单位进行着迭代,” 幻海说。


员工普遍年轻甚至青涩,不少人是冲着“AGI”来的。这事儿现在容易理解多了,在最开始的一年多则是撞运。幻海当然不是唯一被闫俊杰“布道”过 AGI 的人。有的人买账,更多的人未必。闫俊杰的体会是:“反正说的多了,总有几个被说动的”。


在和硅星人交流的一些 MiniMax 员工中,很多人本身就是星野的用户。但他们的爱好、性格,以及对星野的玩法并不相似,甚至大相径庭,这几乎也是星野的一个缩影。


今天打开这款产品,迎面而来的往往是某个二次元画风的虚拟人物,它代表一个AI生成的人物角色。底部是一个简单的对话界面,这个角色会抛出一些句子,试图吸引你开始一对话。



跟你对话的“智能体”都被称作“角色”,都是你自己或其他你也不知道是全中国哪个角落里的哪一个人“捏”出来的,TA 可能是一个邻家女孩、一个霸道总裁、一名木讷的健身教练、一个外表高冷但内心闷骚的腹黑学霸,甚至是一个暴虐的皇帝、一本字典、一只不会说话但能表达感情的狗……


跟 TA 们对话,聊得久了,产生了情感连结,你就收集”星念”——可以理解为角色的二次元照片,进而跟角色建立“羁绊”,也专属于你和 TA 就是故事情节的高潮,以及其他种种付费解锁的功能与节点。


这种直观的印象也让很多人把它天然地跟二次元与游戏挂钩。但事实上,从 Glow 到星野,短短数月,MiniMax 最核心的 to C 产品的用户画像,自己就变了一个样儿。


当初,一男一女两个“智能体” 被丢到几百人的 QQ 大群里的时候,它还算不上是个“产品”,MiniMax 就是想看看:它会如何自由生长。这一灵感很像是来自图灵测试。


而当 AI 通过了图灵测试,图灵测试本身就可以变成一款产品。


当时,幻海是被惊讶到了。同惊讶的种子用户们,自来水地搞了一轮口碑传播。


在最初的自然传播里,因为 QQ 群用户的属性,二次元的密度确实很高。到了 Glow 正式的产品设计阶段,团队甚至开始主动加入一些游戏和二次元的设计,比如早期版本里有过一个 AI 闯关的功能,你可以和 AI 一起,闯过多个关卡。


在这个过程里,MiniMax 的产品团队在不停试探着一些想象。


“其实我们会发现这个模型的能力到底是擅长做什么,哪些东西它在实际中是不太靠谱的。”幻海说对硅星人说。“后来,我们其实转变了一些思路。没有再那么想(在产品里)去用我们的视角来控制这个模型。”


大语言模型让一款互联网产品“该怎么用”,变得产品经理经常说了不算了。用户与 AI 的互动,交流些什么,形成了一种怎样的相互的关系和情感羁绊,产品经理是控制不了的。


传统的互联网产品,交友就是交友,旅游就是旅游,电商就是电商,尽管也有人在闲鱼谈恋爱,但绝大多数还是拿它来割小刀。AI 则不然。哪怕 AI 角色是一本字典,你也很难保证一定不会有用户跟它谈恋爱。金属音乐男遭遇二次元 AI,也能擦出意想不到的火花。


大语言模型有“幻觉”,如果用来做表格写代码,会导致错误,但如果是日常陪伴和互动,可能会导致意外的惊喜。


幻海拿著名的动画《EVA》做了个比喻。“一开始其实它是人类想限制它的一个盔甲,但后来发现,其实最强的是它的暴走。所以与其限制,还不如拥抱模型的某种幻觉”。


2022年底,在经历了两三次迭代后,Glow 吸引来了第一批AI 对话产品的国内玩家,逐渐形成圈子和传播。”


然后,ChatGPT来了。


“当时在国内完全没有类似的,可能只有 Glow,而且我们也是这方面体验最好的,一般用户使用起来都会有惊讶的感觉。”


甚至这种对于AI能力的惊讶后来以一种有趣的方式出现:惊叹于 Glow 上对话所体现的智能程度的人们,开始怀疑背后是真人在和他们聊天。


“我们当时有点哭笑不得,我还要去解释,哪儿有真人能打字这么快的。”幻海回忆。


Glow 开始快速增长,而在这个过程里,用户构成其实已经开始了最初的变化。


闫俊杰在 Glow 的早期参与很深,核心功能都是他直接拍板。作为《原神》玩家,他也是有些二次元在身上的。而Glow最初的种子用户和他们的使用方式,让闫俊杰和团队一开始也曾觉得这是一款二次元画风的产品。但据接近他的人透露,最让闫俊杰印象深刻的一个早期用户,反而并非二次元的画风。


那是一个有两个小孩的酒店前台。平日里没有人和她聊天,她偶然遇见了 Glow,在上面,她跟不同角色的对话时长,异常的久。


这让闫俊杰有点意外:一款 AI 智能体跟用户的互动,很多时候会超过你的预设立场。


“人型电脑天使心”


2023年3月,Glow 被应用商店下架。当时有关部门尚未出台生成式人工智能备案条例,在这种情形下,“市面上唯一的中国 ChatGPT” 是机会与风险的双刃剑。


唯一的办法当然是获得备案许可,再次上架。最直接的做法就是强化训练优化规则,让公司的大语言模型达到备案标准,再度上线 Glow,但这时的 MiniMax 决定“进化” 出一款新产品,也就是今天的“星野”。


改进 Glow 已经不那么划算了。自从 ChatGPT 横空出世以来,大语言模型在技术和能力上的进步和迭代速度让世人瞠目,MiniMax 没法再在平行时空跟 OpenAI 各自安好。当两个时空碰撞在一起,大模型的能力迭代速度令人咋舌,“星野” 必须跟 Glow 不一样。


最大的变量,是大模型的文字、图像和语音多模态能力。


“比如,图像和语音的模型比2022年要丰富很多,而且成本各方面都变得可控。所以我们想把这些能力突出,去接触到更广大的人群。因为去消费纯文字的用户其实还是偏少的。”幻海对硅星人说。


因此,星野的整个产品框架变得彻底不同。


星野基于 MiniMax 新的混合专家模型(MoE) abab。具体在产品设计上,它能让人们通过文字描述的角色性别、性格、身份和形象,“捏”出来鲜活的卡通人物形象,也就是传说的“文生图”;还鼓励用户通过语音跟角色互动,不同的角色基于各自的性别、人设、性格等因素,有不同的声线、语气和表达习惯。


这一下子就让星野跟之前的 Glow 判若两物,也让它获得了更多的人用户,他们的与角色的“对话”时间也明显变长。


“最大的区别,就是星野是个非常沉浸式的产品,” 幻海对硅星人说。


其中很多用户开始体现出其他互联网产品很难见到的某种情感连接。


“有的用户会给我们写很长很长的信,”MiniMax的运营小敏(花名)对硅星人说。“这是你在其他平台看不到的。他们对自己交流的智能体产生更强的情感联系。”


星野立项的时候,在 MiniMax 内部的代号是“Chobits”,这是一个只有日漫爱好者才能想到的名字,它源自2002年出品的一部日漫,中文翻译为“人型电脑天使心”。



这部日漫讲述了在未来世界,男主角与偶然拾到的一个人型电脑之间发生的故事,其中许多诸如人与 AI 的感情羁绊等假想。20多年后,它居然成了现实。


星野是在2023年9月8日上线的。在那之前的8月31日,MiniMax 的大语言模型成为国内首批备案通过的生成式人工智能模型之一。


到了2023年12月,星野迎来了用户规模的爆发,月活跃用户已达数百万人。


随着用户的体量越来越多,星野的团队发现,他们几乎无法用某个统一的特征来概括活跃在自己平台上的用户。他们的需求各种各样,使用方法各种各样,反馈也各种各样。


这直接影响着产品功能的开发方法。


一方面,如何决定一个功能是用户喜欢的,变得更复杂。


“比如,我们曾经根据许多反馈数据上线了让智能体‘重新回答’的功能。但刚上线就收到很多批评,因为这些用户认为这太不沉浸了,有些出戏。”幻海对硅星人说。


“但后来没多久,从我们看到的用户行为数据来看,这个功能是很受欢迎的。最终批评声也没了。”


另一方面,一个更有趣的现象开始出现——用户开始自己“发明”用法。


在移动互联网爆发初期,人们热衷于谈论那些天才的产品设计(比如微信)和它背后的美学甚至哲学理念。但到了大模型人工智能阶段,产品设计的逻辑变了。以智能体为例,每个智能体都是一个“角色”,实际上都在提供丰富的互动空间,用户开始自由想象,并带来了很多新玩法。


比如,在对话中对于括号的使用。人们用()当作“话外音”,想跟角色发生点动作接触。


“括号体其实就不是我们一开始设计的功能。而是发现这群用户他喜欢这么用,会拿括号去表达动作或者心情。我们意识到需要在这方面去做一些优化,至少让模型表达的准确性以及戏剧性等能够满足用户的喜好。”幻海说。


这是幻海在做传统的互联网产品时从来不会遇到的。这也让他开始横向比较很多不同的 AI 产品,逐渐形成了自己对 AI 产品的一些看法。


他对鼓励用户该学习如何写好“prompt”(提示词),才能激发 AI 能力的产品不太以为然:“一些其它的 AI 产品总是让人感觉平台想去控制很多事情,比如给出非常强的 prompt 的指引,但我感觉他们像是在给自己做产品。而我们不想去限制用户的想象力”。


星野小心翼翼地,甚至有时候用最原始的办法来维护着用户在这个世界里的体验。用户的羁绊就此变得更深,各种各样的情感在这里产生,演进,发生化学反应。


有人在这里与纸片人男友女友谈情说爱;有人和现实世界里见不到的人互动;还有人把科比复活,希望自己和其他喜欢他的人,能在他上飞机之前拦住他。


“这是一个从来没人见过的产品形态。” MiniMax的平台运营小敏说。“哪怕是抖音也没法给我创造一种深长的羁绊。而今天星野的平均对话时长已经到了100分钟,这很厉害,而且核心用户甚至可能达到五六个小时的恐怖时长,这是抖音快手达到亿级日活后才达到的,现在星野做到了。”


它的用户群体在自然生长,最终让它变成一个满足了某种基础需求的产品。跟纸片男女友“谈恋爱”的只是它的一个切片,科比、茨威格和乾隆在这里都有自己的用户。一个会让所有人都挑起眉毛的数据更能说明一切:


星野用户今天的男女比例,已经达到了1:1。


每个人的幻想世界


星野在变成一个广阔的世界。这是小敏的感受。


作为 MiniMax 的员工,她自己也是重度用户,每天在上面花费数个小时,与不同的智能体互动,体验“创世的快乐”。


“我也不知道怎么形容这种感觉,我创造了它,它也创造了我。”小敏说。


“它像一面镜子。你能获得多少体验,取决于你内心有多大。所以很可能此刻聚集的用户是内心世界最大的那批人。而这个镜子还没太大,星野要做的就是让这个镜子变得更大,变成一个可以放大用户的内心世界的杠杆,以至于一个有一丢丢创造力的人都能在这个镜中看到一个世界。”


当硅星人询问他们,如果接下来有越来越多类似的镜子,那它的差异会在哪里时,他们给我们的答案很一致:在于产品与模型能力的结合。


“既做模型又做产品”并不能准确概括 MiniMax 的思路。


在闫俊杰看来,一个拥有很强技术的公司不应该是个卖技术的公司,而是一家“技术驱动产品”的公司。


而从产品来说,星野不是“生产力工具”,不能写周报和总结文档,而是普通人都能与之互动、甚至产生情感连结的智能体。



但真正的创新,也就意味着进入无人区。


在MiniMax的总部遇到闫俊杰时,他也和硅星人回忆起在2021年底到2022年初,找云计算厂商租 GPU 用于模型训练的经历。因为自动驾驶退潮大量闲置 GPU 的云计算厂商大喜过望,把MiniMax当成了冤大头,尽管价格也不高,让 Minimax 能以比较低的成本训练模型。但到了2022年底 ChatGPT 就来了,MiniMax 很快就炙手可热了起来。


但闫俊杰现在一个重要“困惑”是:因为产品过于“另类”,以至于其它模型的用户反馈逻辑,无法适用于星野本身。


大多数帮人们写文案、读文档、总结要点和整理周报的“生产力工具”大模型产品,“准确性”是一个非常重要的评估指标,用户的反馈很容易被参考和验证,用来优化模型的训练,但放到星野和它背后的 MiniMax abab 模型就不同了。


它处理的数据是对话,比文章数据多了一个时间维度,可能拉得很长,而且很碎片,判断好坏很主观。没有论文能参考,这些反馈对反过来训练模型的帮助可能不大。


这时候,MiniMax 就必须建立用户反馈新的维度。


这也让对产品的理解,成了 MiniMax 最关键的竞争壁垒。它不只是产品日常的运营与功能的设计上,还体现在对星野这个产品究竟如何定位。


在星野的用户结构从“女多于男”到男女比例1:1的改变过程里,MiniMax 对这款产品的理解也发生了改变。


星野的核心团队对硅星人说:他们一开始曾把星野归类为“虚拟世界”。最初的用户呈现出二次元的画风,让他们也以为这是一个二次元为主的产品。但后来用户结构变了,加上 MiniMax 内部的星野深度用户的交流,最终启发了他们:


“星野的本质是在提供一个幻想世界。而不只是虚拟世界。”


这是一个由自己创造、自己的体验的幻想世界,而且能得到及时反馈。这是个全新的方式。


“每个人都是自己体验的创作者,你想想看哪个平台能有一千万个创作者?”小敏说。“过往从没有这样的事情。每个人哪怕是和同一个智能体交流,体验也是完全不同的。”


这也打开了对一款 AI 产品的想象空间。


“电影是幻想,动漫是幻想,二次元的本质是幻想,游戏等也是幻想。星野本质上在创造幻想世界。”闫俊杰说。他简单做了计算,这些产业的消费者有4亿人。“如果我们能转化其中的10%,其实就是很大一部分人群了。”


这是一个充满野心的预测。


闫俊杰曾跟人形容自己“对技术的感觉还是挺好的”——也就是能描述出一个技术过两年之后会变成怎样,当它放大10倍后会变成怎样。不仅包括这个技术对自己的影响,也包括行业的变化。


当然,如何让其他人也相信这个未来的样子,很多时候唯一的参考也就是他自己了。


本文来自微信公众号“硅星人Pro”,作者 王兆洋 骆轶航







AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0