在 InfoQ 举办的 AICon 全球人工智能开发与应用大会上网易有道国际 App 产品部业务负责人赵越做了专题演讲“AI 创新应用 C 端 B 端商业化实践,从中国走向全球”,演讲围绕 AI 技术在不同市场中的应用和变现策略。
首先,将探讨网易有道是如何利用 AI 技术开发出具有千万级日活跃用户的翻译应用,并分享在北美市场成功占据高比例语音转写市场份额的经验。随后,我会介绍在音乐娱乐和图像娱乐领域的实践,讲述如何在 AI 翻唱领域开发出全球排名第一的应用,以及如何通过创新和技术优势打造图像娱乐类产品,从而在全球市场中获取竞争优势。
最后,我将详细阐述 AI 及大模型技术在 B 端市场中的应用,展示如何有效实现全面覆盖算法研发和销售成本的目标。
通过这些实践内容,我希望展示 AI 技术如何在 C 端和 B 端市场中实现高用户活跃度和高盈利能力。
以下是演讲实录(经 InfoQ 进行不改变原意的编辑整理)。
我今天分享的主题是 “AI 创新应用商业化实践”。这个主题的出发点其实是从“全球走向中国”。
因为我一开始从事的是海外相关业务,之后才逐渐转向国内的产品开发。
首先做一个简单的自我介绍。我目前所在的部门是国际 APP 产品部。我在 2014 年硕士毕业,当时的研究方向是机器学习和人工智能。但在经过三年的硕士学习之后,我意识到自己在学术研究方向上可能并没有太大的天赋,于是毕业后就开始转向 AI 技术的应用落地方向。
从 2016 年开始,我陆续做了多款 AI 应用产品。最开始做的是国际版的有道词典,这是一个相对成功的项目,最初是在印度上线,最高的时候日活用户接近一千万,在全球几十个国家的教育类应用榜单上都能排名第一。
从 2021 年开始,我开始开发多个同传类应用。一开始这些产品主要在北美市场上线,之后才开始拓展到国内市场。其中一个产品叫 Lectmate,是一款专门为中国留学生开发的“留学听课助手”。
因为很多留学生在国外上课时可能面临语言障碍,我们希望通过转写和翻译功能,帮助他们更好地理解课堂内容。这个产品目前在国内同类产品中也可以排到前列。
除了教育方向,我们还做过一款 AI 翻唱类娱乐产品,也是在北美市场推出,在该类应用中也曾排名第一。最近,我们也开始在 To B 方向出海,并开展了一些相关的研究。
我之所以选择“商业化实践”作为分享主题,是因为商业化本质上是大多数公司,甚至可以说是所有公司的最终目标。当然,一开始我也有过困惑。比如在我最初做国际版有道词典的时候,我们的团队一年辛苦下来,虽然产品取得了用户增长,实际上却并未给公司带来利润。
那时候我确实比较迷茫。不过,随着工作经验的积累,我逐渐认识到:所有的工作最终都是为了商业化,只不过每个项目的商业化路径不太一样。
一种是直接商业化,比如通过向用户收费、广告投放、会员订阅等方式来获得收入;另一种是间接商业化,即先提升产品的用户规模(日活),在当前或未来再通过其它方式实现变现。比如现在很多 Chatbot(聊天机器人) 应用目前是免费的,但等它们积累了足够的用户后,就会开始推出收费功能,或者通过产品影响力带来其他变现机会。这种模式也是近年来,尤其是在资本市场驱动下,非常流行的路径。
我认为,一个产品或者一项工作的开展,首要问题是要搞清楚我们走的是哪一条商业化路径。如果这个问题搞不清楚,就很容易陷入内耗。因为你可能每天都在很努力地工作,但回头看,却发现公司账面上是亏损的,这就会对自己的价值产生怀疑。
我们团队在过去几年中做了很多产品上的尝试。回顾这些经历,我总结出一个新产品在市场上取得成功的三种主要路径。
我们发现,很多现在市场上已经成功、甚至可以稳定盈利的产品,往往是在十几年前就已经入局,在该领域长期积累、持续打磨。我们也曾尝试将我们在国内做得非常成功的翻译类产品,扩展到 T1 国家市场(如美国、加拿大、英国等)。但我们很快发现这是一件极其困难的事。虽然我们在 T2/T3 国家 推出翻译类产品时仍然可以获得一定的收入,但一旦进入 T1 国家市场,情况就完全不同了。
我们在这些市场投入了大量资源,但始终难以撼动头部产品,最终赔了不少钱。回头复盘,主要原因在于:
因此,即使我们在买量环节与其效率相当,但对方有额外的 2/3 自然流量作为“补贴”,使得他们可以亏着买、持续投放。而我们完全没有这些“红利”,就意味着再怎么投,也都是亏的,根本无法进行长期竞争。所以我认为,“入局早”本身就是一项重要的战略优势,很多成功案例的底层逻辑,就是他们在合适的时间点进入市场,并持续积累。
如果我们不是最早入局者,那么第二种可能成功的路径就是:产品足够优秀,甚至明显优于竞品。
举一个典型的例子:在北美市场,用户家中普遍拥有庭院,种植各种植物,植物也常常容易生病,比如叶子发黄、掉落等问题。因此,早在 2017 或 2018 年之前,市场上已经出现了识别植物病症的产品,比如 PlantSnap。后来,来自杭州的 瑞奇软件推出了 PictureThis,也进入了北美市场。
结果是,PictureThis 逐步替代了 PlantSnap,拿下了该领域的大部分市场份额。我们深入研究后发现,PictureThis 在产品识别准确率、体验流程等维度上,整体水平远高于原有竞品。这说明,如果产品体验明显优于市场上已有的选择,就有可能打破原有格局,获得用户青睐。
这里需要强调的是:“稍微好一点”远远不够。我们曾经也有过类似的尝试,产品在某些维度可能比竞品略好,但没有形成“明显优势”,最终仍旧无法撼动头部地位。
所以,第二个成功路径的前提是:产品在核心能力上必须具备显著提升,而不是小幅优化。
第三种情形是“有新的技术要素”出现,带来了新的机会窗口。这是近两年来我们特别强烈感受到的一点。比如随着 Stable Diffusion 和 ChatGPT 等前沿技术的出现,带动了一大批具有极强商业潜力的应用爆发。这类技术的出现本身,就在用户体验层面和应用形态上带来了巨大革新,进而重塑了整个产品竞争格局。
在海外市场,我们观察到许多成功的产品,比如:
这些产品每天都能产生非常可观的收入。这说明,一旦有新的底层技术出现,便可能带来新一轮“窗口期”,谁能在第一时间内结合技术优势推出高质量产品,谁就有可能抓住这个时代的新红利。
我想先简单介绍一下我们此前做的产品——U-Dictionary,也就是有道词典的国际版,主要面向 南亚市场,特别是印度等 T2、T3 国家的用户群体。
右边这张图是我们当时在印度教育类 App 榜单中排名第一的截图。回顾这款产品在印度等市场取得成功的原因,我认为主要有两个:
我们出海时主推了两大核心能力。
我们依托国内有道词典多年积累的释义自动挖掘算法和小语种翻译引擎,将这些能力迁移到国际版产品中。虽然需要做一些本地语料收集的工作,但整体翻译效果已经能够与 Google 翻译相媲美——甚至在某些小语种场景中更优。这是因为 Google 往往是基于一个统一模型进行泛化训练,而我们针对不同语种做了精细化调优。
我们的 OCR 技术支持多种字符集,尤其适配了东南亚等地的特殊语言和字符结构,可以覆盖一些非常“稀奇古怪”的字体。这一功能也非常适合用于网红营销,因为它具有很强的视觉冲击力和传播属性。例如,我们支持图像翻译,拍照后自动识别并用翻译内容“盖住”原文,整体效果尽量贴近原图视觉。我们还推出了实时翻译功能(AI 所见即所译),在交互效率和用户体验上都取得了不错的反馈。
OCR 是我们特别下功夫优化的技术模块,因为它不仅能服务国内用户,也能很好支持海外多语种环境。我们做了以下几个方向的优化:
手写体识别;
公式识别;
超模糊图像处理——第三世界国家的手机拍照硬件和光照条件较差,我们专门训练了模型以适应昏暗、模糊的拍摄环境,从而显著提升用户体验。
在海外推广方面,我们主要采用了两种方式:
主要渠道为 Google 和 Facebook,这是一种标准打法。
我们在这一块也走在了较前的位置,早在 2016 年就开始在 YouTube 上尝试。当时做网红合作的厂商还非常稀少。我们发现,如果你的产品是面向大众用户的,那就非常适合做网红营销。我们总结了网红营销的执行经验:
尽管我们在很多国家都做到了不错的成绩,甚至在一些国家成为了品类第一,拥有品牌关键词、良好的用户认知,但始终面临一个核心问题——商业化能力薄弱。这些国家和地区的用户,尤其是我们的主力用户群体——学生(K12),实在是没有支付能力。他们的收入结构决定了他们无法为教育类产品支付较高的费用。我记得看到一句话特别有共鸣,是查理·芒格说的:
“钓鱼的第一条规则是在有鱼的地方钓鱼;第二条是永远不要忘记第一条。”
印度、埃及这样的市场,“鱼实在太少”。我们即使投入了大量资源,做到了品牌领先和产品领先,最后还是挣不到钱。公司也给我们下了明确的商业化指标:如果不能变现,就“你们自己看着办”。于是,我们开始探索新的变现方式,希望打破单一盈利路径的困境。
在 2021 年,我们启动了一个新的产品项目,叫做 iRecord。我们当时有一个非常明确的判断:印度用户没钱,美国用户有钱。所以我们决定将目标市场转向 北美,开发面向美国用户的录音转写类产品,主要应用场景包括:
这个产品的发展路径,实际上也符合我们此前总结的新产品在市场上取得成功的三种情况:
这些因素的叠加,帮助我们在相对短的时间内拿下了北美市场大约 40%~50% 的份额。
我们在 iRecord 中实现了一系列核心功能与技术特性:
在这一产品中,我们也成功实现了商业化变现,相比此前在发展中国家的产品有了明显提升。得益于美国用户更高的支付能力和对效率工具的付费习惯,iRecord 成为了我们出海战略中,第一个“跑通技术→市场→变现”的闭环产品。
在 iRecord 取得阶段性成功之后,我们也开始尝试更多新的产品方向,并继续秉持“找准市场、有技术优势、快速落地验证”的理念,不断探索海外的创新机会。
AI 娱乐是一个在全球范围内增长非常迅速且潜力巨大的赛道。头部公司每月营收可以达到数千万美元,日收入在 40 万美元左右。据我们掌握的一些内部消息,这类产品的利润率大约在 30%,也就是说,一家公司每天可以净赚约 10 万美元的利润。这个体量对任何一家创业公司来说,都是非常可观的。
我们注意到国内的 AI 孙燕姿翻唱功能火爆之后,立即将这一能力产品化,并迁移到海外市场,让用户可以自定义训练任意一个他们喜欢的音色,让这个音色去翻唱任意一首歌。这个产品在海外也取得了不错的反响,可以看作是一个从国内场景出发、通过“时光机效应”在国外市场重现成功的案例。“时光机理论”依然在发挥作用。类似的例子还有妙鸭相机。
它上线之前,海外市场就已经有非常相似的产品——Lensa。Lensa 在高峰期的日营收能达到 200 多万美元。这个趋势验证了一个现象:一些在国内成熟并成功的产品形态,往往可以在海外市场再次爆发,仿佛历史总是在一遍一遍地重演。
在已有产品基础上,我们还持续进行了功能上的扩展。例如,AI 翻唱产品中加入了伴奏替换功能,一首歌可以切换为爵士、摇滚等不同风格的伴奏;我们也开发了超拟人的 TTS 技术,不仅用于娱乐类产品中角色语音的生成,也作为功能亮点用于广告素材制作。这些 TTS 引擎的生成效果已经几乎无法与真人语音区分,因此在用户体验上极具吸引力。我们还尝试了将这些 TTS 技术用于广播剧的制作,虽然技术实现上没有问题,但从市场反馈来看,这个细分场景的规模有限,变现能力也比较有限,不太可能成为核心的营收来源。
综合来看,我们认为海外娱乐类 App 会长期存在并持续涌现机会。即使像 ChatGPT 这样的大模型占据了市场主导地位,其它中小型的 Chatbot 仍然可以拥有可观的收入。与国内不同的是,在海外,绝大多数 Chatbot 都是付费产品。在这个市场上,最核心的逻辑只有一条:只要你的产品单元经济模型能跑正,就能持续扩张规模。
而不像国内,很多公司采用烧钱补贴的方式来争夺用户。图像类产品在海外也同样具备非常强的商业化能力。例如美图类的工具型产品,依然能带来稳定且可观的营收规模。这也说明,在 AI 娱乐和视觉创意类方向上,海外市场还远未饱和,依旧充满机会。
我们在寻找新方向和启动新项目时,其实采用的方法和许多团队类似,首先会搭建一个情报系统,用来追踪并遍历市场上新近出现、且增长势头较快的产品。在使用情报系统时,有一个非常关键的判断要做:这个产品究竟是真的具备盈利能力,还是在依赖资本进行补贴式增长。这个判断非常重要,如果分辨不清,就很容易偏离自己的目标和资源能力,导致方向跑偏。
在确定一个方向是否值得尝试时,我们强调的是与竞品之间的相对优势。只要我们具备明确的优势,就有可能做得起来;反之,如果优势不明显,进入这个市场的性价比就会很低。我们内部有一个明确的原则,叫做“先射子弹,再射炮弹”。
也就是说,先做一个基础版本的产品,甚至这个产品可能都还达不到 75 分,先推向市场测试一轮。如果市场反馈好,我们再加大投入;如果反馈一般或者不行,那我们就会及时止损,转而寻找下一个机会。
不过归根结底,到最后比拼的还是核心能力。无论你是做 B 端产品,还是内容型产品,还是 AI 驱动的产品,最终决定竞争力和可持续性的,是背后的技术、算法、资源、商业理解等方面的综合能力。前期的技术红利或打法差异可能会带来一时的领先,但从长期来看,所有表面的差异都会被拉平,剩下的就是硬实力的对抗。
我们在评估一个新产品能否建立竞争优势时,通常会从五个维度进行判断。
我们会以这五个维度为标准进行全面评估:只要在这些核心要素上能形成足够竞争力,我们就会坚定投入;如果评估下来不具备优势,我们就果断转向,不做无效投入。
第一点,我认为最重要的就是多看。移动互联网已经发展了十几年,准确地说已经是第 11 年了。大机会基本都已被占据,小机会也大多被人发现并入局。不过,小机会虽已存在参与者,头部竞品的能力可能并不强,还有可操作的空间。与此同时,技术的持续演进也会不断带来新的“窗口期”。比如我们刚刚提到的 Lensa,它的母公司其实是一家小公司,但依靠一波技术浪潮依然在这个市场中赚到了钱。
第二点是“慢慢跟、慢慢抄”。新技术并不是每天都诞生的,如果没有新技术,就很难拿到新机会。但这不意味着什么都不做。平时我们要做的就是练内功:在已有的成熟产品上,打磨自己的投放方法、商业化策略、产品功能,持续总结成功的方法。对标竞品抄是一个非常直接有效的方式。不是简单照搬,而是理解其路径和打法,优化为自己的方案。
第三点是等待。我们在能力打磨好之后,要有耐心等待新的技术或新机会的出现。一旦技术浪潮来了,准备好的人才有可能第一时间抓住它。
最后一点,我想讲的是先做中小机会。中小机会通常门槛较低、落地难度也相对较小,适合作为团队的“基本盘”。一方面,它可以稳定现金流和团队状态;另一方面,也能为后续搏击更大机会打下基础。大的机会当然值得追,但当下能拿下的先拿下来,大的拿不下也没关系,等时间够长,总会轮到你。
这一点我们团队体会特别深。过去公司老板经常 push 我去研究一些特别大的方向。但我的经验是:如果一开始就盯着所谓的“大机会”,我们团队早就“死好几回”了。所以我们并不刻意去追逐“宏大叙事”,而是选择了更踏实的打法。
我们团队主要做的是 AI 的 C 端产品,这些产品成熟后,相关技术也会向 B 端输出。反正技术已经沉淀好了,多卖一次就是多一份收入。但我们也清楚,在国内做 B 端公司是很难的。我们系统性地研究了多个 B 端公司的财报,发现几乎都处于亏损状态,而且这种亏损并没有好转趋势。
相比之下,英伟达提供了一个更具启发性的 B 端公司模式。它并不直接提供产品解决方案,而是提供那些大众产品不可或缺的能力——显卡。显卡一旦交付出去,客户就可以基于它去训练模型、提升估值、甚至“挖矿”、开展商业应用。
也正因如此,英伟达的产品始终处于供不应求的状态。这种做法给了我们启示:如果我们能帮助 B 端客户赚钱,或成为他们产品里的关键能力,就可能建立起更稳定的商业模式。
此外,我们还看到了另一个值得关注的机会:国内 AI 能力“质优价廉”,在海外市场具有竞争力。以语音识别(ASR)为例,我们发现谷歌、微软等海外头部厂商的平均价格在 1 美金每小时,约合 7 到 8 元人民币,而国内的 ASR 厂商标价通常只需 2 到 4 元人民币,价格优势非常明显。因此,我们最近也在积极推动国内 AI 技术向海外市场的输出。
赵越,网易有道国际 App 产品部负责人,成功研发了多款广受欢迎的 AI 应用,包括有道词典国际版 U-Dictionary、iRecord 和 LectMate。其中 U-Dictionary 在全球教育类应用下载量中名列前十,iRecord 和 LectMate 分别在北美和中国大陆的语音转写领域排名前列。此外,在 AI 音乐和 AI 图像处理方面也取得了多项成功案例。
AICon 2025 强势来袭,5 月上海站、6 月北京站,双城联动,全览 AI 技术前沿和行业落地。大会聚焦技术与应用深度融合,汇聚 AI Agent、多模态、场景应用、大模型架构创新、智能数据基建、AI 产品设计和出海策略等话题。即刻扫码购票,一同探索 AI 应用边界!
文章来自于“InfoQ”,作者“AlCon”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales