4 月 16-19 日,AI 公司「出门问问」在港交所招股。
据悉,出门问问的港股打新持续火爆,首日发售超额认购超 8 倍,目前已近 30 倍覆盖。另招股首日,国际配售部分已超额,其中国际及中资意见领袖型机构均积极下单参与。
除了 AIGC 风口之上的赛道火爆,在二级市场,更有分析师将出门问问定位为「唯一盈利的 AIGC」股。目前,热炒一年多的生成式 AI 浪潮在二级市场并没有太多标的。因此,出门问问的上市对二级市场来说是一个很好的补充,市场本身表现出了一定的热情。
从招股书中看,出门问问的商业模式十分清晰,来自 AI 软件收入持续扩张,并且已于 2022 年实现盈利,打破了二级市场对 AI 标的盈利遥遥无期的顾虑。
24 日,出门问问将正式以 “2438” 的股票代码在港交所主板挂牌上市,成为「AIGC 第一股」。
从初创至今的十二年,出门问问已是国内人工智能领域元老级的公司。2012 年,出门问问创始人李志飞从谷歌研究院离职,回国以语音交互方向开始创业,是国内最早一批的人工智能创业者。
2023 年初,由 ChatGPT 点燃的生成式人工智能浪潮下,由于李志飞本人自然语言处理专家的背景以及出门问问在语音交互与生成式 AI 的积累和提前布局,李志飞成为最早掀起中国大模型热潮的创业引领者和专家。
从 AI 语音起步到现在的 AIGC 大模型,从深度学习革命的第一波浪潮到生成式人工智能的大模型浪潮,出门问问在十二年的创业过程中实现了周期穿越,走出了一条属于自己的技术创新和商业化之路。
2022 年已实现盈利,AIGC 业务复合年增长率超 300%
招股书中,出门问问定位为一家以生成式 AI 与语音交互技术为核心业务的 AI 公司。目前,出门问问共有两条主要业务线:AI 软件解决方案与智能设备。
AI 软件方案方面,针对 C 端内容创作者推出 AIGC 全栈解决方案,包括 AI 配音助手 “魔音工坊” 及海外版 “DupDub”、提供虚拟直播的 AI 数字人 “奇妙元”,以及短视频 AI 生成平台 “元创岛”。
针对企业端,出门问问为汽车、金融、TMT 及其他行业量身定制 AI 软件解决方案 “奇妙问”,提供 AI 语音交互解决方案,用于车载、AI 反欺诈,以及智能客服等场景。
自 2020 年以来,出门问问在全球拥有超过 1000 万名 AIGC 解决方案用户,推出 AIGC 解决方案以来的 AIGC 付费用户超 86.5 万名,已产生 100 多万笔付款。
财务方面,目前出门问问已连续两年实现盈利。2021 年 - 2023 年,公司的营收分别为 3.98 亿元、5 亿元、5.07 亿元;毛利率分别为 37.5%、67.2%、64.3%;经调整净利润分别为 - 7344 万元、1.09 亿元、1754 万元。
值得注意的是,出门问问来自 AI 软件的收入占比在近两年持续扩大,并且在 2023 年超过此前出门问问的第一大营收 AIOT,成为出门问问的支柱产业。
具体数据显示,出门问问 AI 软件收入从 2021 年的 0.60 亿元增长到 2023 年的 3.43 亿元,年复合增长率 140%,对应收入占比从 2021 年的 15% 上升到 2023 年的 67.7%。
另外,招股书显示,该业务线营收的大部分扩张主要是由于 AIGC 解决方案的付费用户数量增加,导致 AIGC 解决方案的收入增加。其中,公司从 AIGC 解决方案获得的收入增速迅猛,2021 年至 2023 年分别为 682.2 万元、3985.7 万元和 1.18 亿元,复合年增长率超 300%。
2022 年及 2023 年,出门问问毛利及毛利率亦有所改善,毛利润分别为人民币 1.492 亿元、3.362 亿元、3.261 亿元,近三年毛利率分别为 37.5%、67.2%、64.3%。
整体上看,出门问问的商业模型包含三层。
在底层,利用此前的积累,构建自己的大模型底座。2020 年,出门问问推出自主研发的通用大模型 “UCLAI”,该模型后于 2023 年升级为多模态大模型「序列猴子」。「序列猴子」以语言为核心的能力体系涵盖 “知识、对话、数学、代码、思维链、规划” 六个维度。基于这个大模型底座,出门问问以 AI CoPilot 的产品形式面向企业和个人提供产品解决方案,主要服务内容创作者与中小企业。
这个商业模型不同于主打模型和主打应用的两条路径,出门问问选择在模型和产品两端共同发力。出门问问创始人李志飞将这种模式定义为 “产模结合”——「产」指 AI 产品,「模」指 AI 大模型,这不仅仅是文本大模型 LLM,而更是大一统的多模态大模型(LUM:Large Unified Model)。
「产模结合」,即产品和模型一体化,如果一家公司既有产品、又有模型,那么这家公司就更有机会形成数据飞轮,具备更强的核心竞争力。
“大模型像个吸金黑洞,国内的投资环境也不乐观,多数创业公司如果没有自己产品的造血功能,想依赖一轮接一轮的融资,是不可持续的。应用产品测的反馈,无论是 bug report,还是场景数据,对于模型的闭环健康发展以及建立场景应用的护城河都是极为重要的。” 李志飞表示。
有着实际数据指标的「产品」如同灯塔,为航行中的游轮指明方向;「多模态大模型」则像游轮的发动机,为不同模态的多艘游轮提供源源不断的动力。
李志飞认为,产模结合的路径对效率的提升毋庸置疑:
首先,拥有自己的模型,产品问题可以得到快速响应。很多公司的产品面向海量用户,难免遇到紧急的需求或者问题。在此情况下,有自家模型的公司可以快速调整底层逻辑或数据,做到第一时间解决问题,而调用其他大模型的公司,难以与之匹敌。
其次,自己的模型让成本更可控。在当下主流的 Maas 收费模式下,比起那些只能依靠调用外部大模型 API 来做产品的公司,有自己模型的公司可以多种方式降低产品开发和运营的成本,无论是模型的继续训练、微调、RLHF、In-Context-Leaning 的模版设计,还是为了应对实时推理环境下高并发的需要对模型所做的 “蒸馏”。
第三,产模结合的公司可以做到针对用户需求进行可配置能力的开发。例如,针对用户的数据安全 concerns,可以快速实现特定场景下的可配置模型的开发。这包括智能体外挂、场景配置以及灵活部署(例如让数字员工适配不同的大屏硬件)。这样的灵活性带来了效率的提升和品质的保障,也为产品的快速迭代(例如,至少常规保证周迭代)成为可能。
当然,产模结合最大的魅力,更在于它能够实现更彻底的端到端训练,进而形成「数据飞轮」效应,最终实现让数据自动驱动模型和产品的更新迭代。
传统 AI 产品的一般采用过程性的管式(pipeline)系统架构,模块层层依赖、串联,Input 与 output 两端之间有很多中间结果,模块化的链路很长。
这种 AI 应用有其固有的优势,包括实现难度可控,过程透明,定点纠错,开发人员对此套路也驾轻就熟。
然而大模型新范式追求的是端到端数据驱动,以模型训练替代 pipeline 的过程性,这是实现真正意义上的数据飞轮闭环的必要条件。理想的大模型产品在产品架构定型上线以后,产品的迭代提升可以随着流程化的回流数据自动训练增强。长远一点看,新范式下端到端训练的系统对于传统的管式系统具有碾压性的威胁。
端到端方向对产模分离的架构构成了巨大的挑战,而产模结合则为此提供了可能性。一方面,产品矩阵源源不断地收集经同意的用户反馈 “埋点” 数据,反哺一体化大模型的人类对齐训练,模型的数据质量会随之提升;另一方面,不断迭代的模型可赋能产品能力的提升和体验的优化,越来越对齐用户期望和需求的产品会吸引更大的用户群,带来更多的数据回流。以此构筑的数据壁垒和用户壁垒,才不至于被通用大模型的升级换代而碾压。
距离 2012 年李志飞从谷歌回国创业,已经过去了十二年。十二年之中,人工智能领域历经了深度学习和大模型带来的两波大浪潮,经历过技术突破吸引全球关注的高光时刻,也经历过广受质疑,被认为无法落地、巨额亏损的负面声音。
出门问问的创业历程完整经历过上一波周期。2009 年,深度学习系统被应用在语音识别领域后,语音识别技术的精度一举被提高到 90% 以上。语音识别助手开始在产业落地,两年后,2011 年带有 Siri 功能的 iPhone 4S 正式面向外部推出,引爆全球对 AI 语音助手的关注,AI 语音创业赛道正式开启。
2012 年,李志飞从谷歌离职,抱着做出 “下一代人机交互” 的目标使命正式开始回国创业。同年,国内 AI 语音赛道另一家初创云知声成立,思必驰也开始正式大量投入 AI 语音技术,上市公司科大讯飞 2012-2013 年营收增速超过 60%。国内 AI 语音赛道快速繁荣了起来。
2013 年,李志飞推出第一代产品中文语音搜索服务,并建立了微信语音搜索服务平台。但很快发现,近场语音交互的场景限制以及人工智能技术不成熟带来的效果不佳,让 ToC 软件服务陷入困境。出门问问在商业化上开始遇到瓶颈。
李志飞做出了一个重要决策 —— 转型做智能硬件,提出让 AI 附体于智能可穿戴设备的「软硬结合」之路。这个决策完全改变了出门问问的商业化方向,让出门问问从一个单纯的软件技术服务商,变成了一个覆盖算法、硬件、供应链、销售、品牌、电商的全栈式软硬结合公司。
2014 年出门问问推出智能手表操作系统 Ticwear,翌年,智能手表 TicWatch 问世,并一举打响海外市场,成为倍受全球消费者爱戴的品牌。2016 年,出门问问进军车载市场,推出智能后视镜问问魔镜 Ticmirror 和后装 ADAS 产品 Ticeye 等。
李志飞的这种自我造血的意识让出门问问在早几年的行业低谷中安然无恙,并且持续地厚积薄发,为之后的技术爆发做准备。
2022 年末,ChatGPT 的横空出世引爆了全球,生成式 AI 浪潮席卷而来。相比上一波监督式深度学习浪潮,现在的 Transformer 大模型通过自监督学习,可以在海量无标注数据上预训练,从而获得强大的语义理解和知识泛化能力。AI 的通用性更加凸显,通用人工智能(AGI)仿佛不再遥不可及。
在生成式 AI 的浪潮下,出门问问重新回到大众视野,成为中国大模型领域的先行者和布道者。2023 年初,许多人将李志飞视为 “中国版 OpenAI” 最具实力的人选。
然而,大模型时代对算力和数据的无止境的需求,让创业者面临二元抉择:要么专注模型,要么聚焦应用。而李志飞开启的 “产模结合” 之路,为行业指明了一种全新的可能性。这种商业哲学折射了出门问问在上一波 AI 周期下衍生的谨慎,也体现了出门问问对大模型核心技术不懈追求的决心。
回顾出门问问的发展历程,我们可以看到,除了这家公司的前瞻性和远见,几乎每一次都稳居浪潮之前,还有在面临重重挑战时展现出了非凡的韧性。
当人机交互服务陷入 “人工智障” 的时代局限的时候,他们大胆地转型,开始独创探索 “软硬结合” 的道路。当华为、小米等巨头进军智能手表市场,他们迅速调整策略,发掘出车载语音这一新的市场蓝海。当其他公司陷入高级人力外包的 “项目制” 困局时,又率先开启生成式 AI 的探索,当纯粹的大模型之路因资源门槛过高而难以为继时,出门问问灵活地转向 “产模结合” 的 AIGC 创新模式。
AI 的商业化之路有多难?创业公司要精于出题,也要在每一个困局解题面前,展示出坚韧不拔的意志和灵活多变的应对能力,在逆境中寻找新的生机,正是出门问问穿越周期迎来 AIGC 爆发的底蕴之一。
在国内外科技发展史中,所有存活下来并且成功从小变大的公司都有这样共同的特性。无论是苹果、谷歌、微软、亚马逊,还是腾讯、字节、阿里、美团、小红书。创业难的是如何在起伏变化的技术和市场发展中,不断拓宽自己的边界,持续创新、试错,最终找到属于自己的道路。
在当今的投资和创业环境中,创业公司要赢得信任,仅仅依靠 “宏大愿景” 已经不够了。面对挑战和挫折时表现出的适应力和恢复力,即所谓的 "逆商",变得日益关键。在这轮人工智能浪潮的冲击下,技术边界的突破变得更加频繁,爆炸式的技术创新在带来新机遇的同时,也导致了行业格局的剧烈动荡。
对于一个在商业周期中经受过生死考验和磨砺的公司而言,其所拥有的诸多品质尤为宝贵:灵活的组织架构、高效的决策机制、敏锐的风险意识、超凡的环境适应能力。这样的公司才能在瞬息万变的市场环境中,保持竞争力和生命力。
十二年磨一剑,李志飞用自己的商业哲学平衡了技术创新与市场需求,他所带领的出门问问穿越了深度学习与生成式 AI 的两波浪潮,经历过风口浪尖、也曾陷入行业低谷,现在以一种平稳的姿态驶向了新的里程碑。
文章来自微信公众号”机器之心“,作者 Esther
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales