9 月份,最著名的语言学习类 App 多邻国发布了他们的 AI 功能的大版本更新。
视频通话,可以与多邻国最受欢迎的高冷角色拽姐 Lily 进行逼真的实时对话,拽姐很了解你,所以即使你外语很差,也能无压力的对话。毫无疑问,这个功能需要额外付费——只面向 Duolingo Max 订阅用户,比现在的订阅要贵。
另外一个新功能是内置的一款冒险游戏,尝试在游戏里解决现实场景里遇到的语言交流问题,面向所有用户。
用 AI 来让语言学习变得更有趣,以及加入更多游戏功能,正如多邻国创始人 Luis von Ahn 在采访中所说,相比较学习效率,「我们更愿意让你留下来——而不是效率更高。」
这可能也是多邻国能吸引那么多人一直坚持下去的原因之一。
在新功能发布后,多邻国创始人 Luis von Ahn 接受了 The Verge 资深记者 Nilay Patel 的专访,关于多邻国的核心机制、真实的用户数据、以及如何盈利、如何用 AI 辅助语言学习等,有很多料,值得一读。
一些有意思的点:
Nilay Patel:我觉得每个人都知道多邻国是什么。你如何定义多邻国?
Luis von Ahn:它是一个教语言的应用程序——这是我们最为出名的介绍。不过在过去几年里,我们也开始教数学和音乐。
多邻国是世界上最流行的学习语言的方式。有趣的事实:在美国,使用多邻国学习语言的人比所有美国高中生加起来还要多。这在世界上大多数国家都是如此。我们的语言教学规模比公立学校系统还要大。
Nilay Patel:你们在 Duocon(多邻国的开发交流大会)上有一些大的发布,其中之一是能够与像 Lily 这样的角色聊天。
Luis von Ahn:是的,与 Lily 进行视频通话的能力。
Nilay Patel:这是怎么做的?你们是如何实现的?
Luis von Ahn:我们有一批用户喜欢的角色。其中之一是一个紫色头发的「拽姐」Lily,她看起来对你非常不屑。你可以和她交谈,练习你的对话技巧。而且她能适应你的水平——我们知道你的水平,因为你一直在多邻国学习,所以我们对你的水平有一个很好的了解。
另一点是,她有记忆功能,所以她记得上次你们谈论的事情。例如,我今天刚进行了一次对话,她记得上次我们谈论了我喜欢 Nirvana。她告诉我她最喜欢的歌是「Smells Like Teen Spirit」。
Nilay Patel:不得不说,很大众的选择。
Luis von Ahn:暴露年龄了。但总之这些对话非常愉快,口语练习的效果非常好。我们非常高兴,因为我们第一次意识到,「我们真的不需要人类来做这个,AI 能做得很好。」
Nilay Patel:那些人物动画,是现成的循环播放的动画吗?还是实时工作的?
Luis von Ahn:它是实时动画。我们为她配备了一个动画系统。我们在底特律买了两家动画工作室。这就是我们在底特律设有办公室的原因。他们做得很好。她说话时嘴巴会动,并且和她说的话同步。她还会对你翻白眼。
Nilay Patel:这是一个很大的投资。这真的会让你现有的用户愿意支付更多钱吗?还是它会给你带来更多新用户?
Luis von Ahn:我认为两者都有。我们将其视为继续升级改进 app 的一部分。我们在很多地方都大量使用动画,随着我们继续改进 app,我们会吸引更多用户,并让更多用户付费。
Nilay Patel:AI 的经济学/商业变现现在只是一系列问号。我问了每个正在进行 AI 投资的人,大家都一头雾水。你认为最终会怎样?
Luis von Ahn:至少对于这个特定的功能,我认为这是大语言模型的极好用途,在我们这边,它工作得相当好。
Nilay Patel:你还有另一个大宣布,叫做「Adventures」。听起来像是一个视频游戏?
Luis von Ahn:游戏模式就是一条显示在主屏幕上的小路,你沿着那条小路一步步向下深入,学习课程。现在,一些课程将变成我们称之为「冒险」的东西,这实际上就是你操作角色的那种游戏。不同之处在于,你可以在多邻国上学习如何解决现实世界的语言交流的情况。
例如,你在其中扮演一个角色,被告知「好的,去买一个披萨」。你移动并询问周围,然后你问一些人,他们告诉你「哦,披萨店在那边」。这非常有趣,它帮助你学习如何在现实世界中导航。所以我们一直在研究这个。这个功能的场景大多是由 AI 生成的。在过去,这个功能需要很长时间才能扩展,但因为 AI,我们能够迅速扩展它。
Nilay Patel:很多人对多邻国的印象都来自于它的吉祥物。我想聊聊这个吉祥物的性格和它在社交媒体上的活跃度,但它给人的感觉并不是一个真人在教你语言。为什么用这些动画形象而不是真人教师?
Luis von Ahn:我们有意不在应用里加入真人教师。这并不是说真人教师有什么问题。只是我们从一开始就定位为一家技术公司,我们的目标是让技术来完成教学工作。我们这么做有几个原因。其中之一是,用技术教学比真人教师要经济得多。
还有一点,80% 到 90% 的语言学习者并不想和真人交流。他们可能嘴上说着他们愿意,但实际上并不愿意。因为在学习语言的过程中,人们通常会感到害羞,只有非常外向的人才会愿意用他们不太擅长的语言和陌生人交谈。大多数人并不愿意这么做。
我们多年来一直在做研究,因为随着时间的推移,我们想过也许应该加入真人教师。但这些研究结果是我见过的最令人惊讶的事情之一。
当你问用户,「你觉得什么能让多邻国变得更好?」
他们通常会说,「嗯,和真人进行更多的练习对话。」
然后你问用户,「好吧,你告诉我,如果我在多邻国上加入真人教师,你会愿意吗?」
他们会说,「是的,我愿意。」
你甚至可以问他们,「你愿意为此付费吗?」
他们会说,「是的,我愿意付费。」
然后你最后问他们,「好吧,那你现在愿意尝试吗?」
答案总是,「不,不,现在不想。」
人们就是不愿意这么做。这就是我们没有加入真人教师的原因,我认为这是一个正确的决定,尤其是现在我们能够通过大语言模型在没有真人教师的情况下让你很好地练习对话。
Nilay Patel:我之所以问这个问题,是因为我在节目里问过很多人:这些大型语言模型有什么用?你们打算用它们来开发什么产品?我明白你们在制作这些模型,而且感觉多邻国有一个非常自然的解决方案,那就是你可以和它对话,它也会回应你。如果大模型有幻觉,那也没关系,因为只是在练习对话。
Luis von Ahn:没错,即使它说错了些话也没关系,因为你只是练习语言。而且,即使它偶尔犯了小语法错误,很多人也不会注意到,因为他们通常是西班牙语或法语的初学者。它还能很好地适应你的水平。大型语言模型在这方面表现得非常出色。
我们会告诉它,「适应一个西班牙语的初学者。」我们甚至告诉它,「嘿,因为我们已经在多邻国上观察了这个人的学习情况,我们知道他所有会的单词。」所以我们告诉语言模型,「这个人只认识这 200 个单词,请主要使用这 200 个单词。」这样做效果非常好。
Nilay Patel:你们在 AI 这块砸了多少钱?大家都在跟我抱怨 Nvidia 的 GPU 价格不菲。你之前提过你们这才刚有盈利。感觉你们这一投 AI,立马又要回到亏损状态了。
Luis von Ahn:我们确实在人工智能上砸了不少钱。幸运的是,这对我们盈利来说是有益的,原因有两个。首先,我们用 AI 来生成课程数据。这些数据以前部分是人工生成的,现在基本上都交给 AI 了,成本比人工低得多,速度还快,我们对此非常满意。
再就是实时对话功能,这一块成本挺高的。要为用户提供实时对话服务,开销不小,所以我们推出了一个更贵的订阅计划。我们现在有两种订阅选项:标准版的 Super 多邻国,还有新推出的这个多邻国 Max,Max 的价格是 Super 多邻国的两倍,但提供了对话练习功能。虽然成本高,但用户愿意为这项服务支付更多,实际上整体并没有影响我们的利润。这策略对我们来说效果不错。
Nilay Patel:我想深入了解一下这方面的经济账,因为我一直很感兴趣,想知道这些投资最终会不会造就一些能盈利、可持续发展的公司。现在这个领域可是吸引了不少资金。你们为了做推理分析而收了两倍的费用,这是用了别人家的大型语言模型吗?
Luis von Ahn:是的,用的 OpenAI。
Nilay Patel:你们是从 OpenAI 买 token,然后以你们标准计划价格的两倍卖给用户。这笔买卖你们能赚多少?
Luis von Ahn:我不清楚具体的数字,但我知道至少不亏。由于种种原因,同样的 AI 调用成本随着时间的推移会逐渐降低,不管你是通过 OpenAI 还是微软来实现。一切都在变得更高效,而且芯片的成本也在逐渐降低。目前,我们的利润空间还挺大,但预计未来这个空间会更大。至少对我们的应用来说,我不太担心利润率的问题。我们的利润率还算不错。
Nilay Patel:你觉得这些模型可以在一定程度上互相迁移吗?我越来越常听到这样的说法,认为模型业务不是关键,产品业务才是关键。
Luis von Ahn:我觉得答案是肯定的,但是在「一定程度上」。它们「一定程度上」是可以互换的。我们尝试构建我们技术栈的方式就是让这些模型可以互换,但实际情况是你可能会遇到一些奇怪的问题,因为你可能花了很多时间来测试并找到正确的查询方式,你或许还做了一些微调。你可以互换它们,但如果这么做,你可能需要花上几个月的时间来确保那些奇怪的问题被解决掉。
正在教日语的多邻国酱(用户二创)
Nilay Patel:当你考虑这项投资的长期回报时,是不是觉得需要先投入资金,然后在后期变得更高效?还是觉得「哦,这将是公司的未来,所以我们需要围绕大语言模型的能力进行重建」?
Luis von Ahn:这个情况有点介于两者之间。我确实认为大语言模型对多邻国来说是非常积极的。但并不是说大型语言模型能解决我们所有的问题。人们尤其不太谈论教育领域的一个大问题是,大语言模型擅长教你知识,但不擅长保持你的参与度。而这正是教育中最困难的事情。
我试图教你一些东西时最困难的事情就是保持你的兴趣。不知怎的,人们会忘记这一点。我看到有人说,「你可以用 ChatGPT 学习量子物理。」对,当然可以,但这并没有什么令人惊艳的。你可以通过一本书来学习量子物理。这种学习技术已经存在很长时间了,它叫做书,而且很有效。只是人们不太想读量子物理的书。同样地,大多数人可能也不想去 ChatGPT 上问量子物理的问题。语言学习也是一回事。大语言模型非常擅长让你开始学习,但保持你的参与度就相当困难了。
我不确定大型语言模型在这方面能帮上多少忙。说来有点悲哀,但事实是,多邻国非常游戏化。我真心相信大多数人宁愿花更多时间玩《Candy Crush》而不是和别人交流。这可能是个悲哀的真相。当然也有一些例外,我是说,人们喜欢和他们爱的人交谈,那确实很好,但现实是,大多数时候,大多数人宁愿花时间玩《Candy Crush》或者刷 Instagram,而不是和别人交谈。我只是觉得大型语言模型在这方面也帮不上太大的忙。
Nilay Patel:什么语言最流行?
Luis von Ahn:英语,远超过其他语言。45% 的活跃用户在学习英语。第二是西班牙语,第三是法语,再往后就差很多了。
Nilay Patel:大部分用户是在美国境外还是境内?
Luis von Ahn:美国大约占我们用户的 20%,80% 是国际用户。
Nilay Patel:那么那 80% 的用户都是在尝试学英语吗?
Luis von Ahn:大约 45% 的用户在尝试学习英语。国际用户他们也想学习其他语言。
Nilay Patel:应用程序中提供了很多语言学习课程。你分配资源的一种方式可能是,「英语最受欢迎,我们将在那里投入最多的资源。」是吗?
Luis von Ahn:我们确实有一点这种倾向。但是我们没有完全地与用户数量相称地分配资源,因为那样我们可能会将所有资源都投入到英语、西班牙语和法语上。我们在前八种学习语言上投入了大部分资源,然后我们在那之外投入的资源非常少。排名靠前的语言依次是英语、西班牙语、法语、德语、意大利语、日语、韩语、葡萄牙语(我想应该是这个)、中文。
Nilay Patel:普通话还是粤语?
Luis von Ahn:普通话。在那之后的语言学习的人数就大幅下滑了。例如,阿拉伯语是一个大语言,但学习阿拉伯语的人并不多。所以我们确实在那里投入了一些资源,但远少于较大的语言。
Nilay Patel:其实很多人对语言学习的需求是潜在的,有些人想不到自己要学外语,又有些人想学一门外语,但是不知道学什么好。你有没有尝试过做这种营销?比如说告诉别人说:「你应该去学西班牙语。」或者把西班牙语的推广重点放在在美国南部一些洲?
Luis von Ahn:我们不会这么干。我们对此一直保持中立,而且学习语言的需求,一不直接和这门语言的大小有关,二不与地缘政治或者地理位置有关。例如,即使中文是我们前八种学习语言之一,也只有大约 2% 的用户在学习它。学的人很少——即使它是世界上说的人最多的语言。
真正影响一个人决定学什么语言的因素是学习这种语言有多难。至少对于英语使用者来说,中文太难了。我们有数据。对于英语使用者来说,西班牙语达到相当好的水平需要大概 300 到 400 小时;然而达到同样的水平对于中文来说需要大约 2000 小时。现实情况是,在美国,如果你只是为了实用,西班牙语可能要好得多。因为它是一种相当容易学习的语言。
Nilay Patel:好的,「在美国,你可能会想学习西班牙语。因为它是一种相当容易学习的语言。」这就是个营销话术了。
Luis von Ahn:不不不,我们不这么说。我们真的一直试图保持中立。
Nilay Patel:我觉得很多人其实并不想学习第二语言,至少我观察社媒上的一些舆论,很多人——至少在美国,他们会说,「管它呢。我说英语。」第二语言有价值的想法对他们来说是陌生的。
Luis von Ahn:确实有很多这样的人,在美国和英国这些英语国家,学习语言的欲望一直不大。但我对多邻国的用户反馈结果很满意。在美国,80% 的用户在多邻国之前没有学习过语言。我们在美国成功地增长了市场。在英国的数字也是一样的。我对这个感到非常满意。
Nilay Patel:我高中时学过法语。学习语言,往往伴随着语言背后的文化,特别是某些地区。高中学法语地时候总是在看一张张法棍面包的图片。你们会考虑这个吗,多邻国有没有考虑文化因素?
Luis von Ahn:我们确实尝试添加了一些文化元素,但我们没有把它当作重点,我们主要专注于语言教学。其实这也取决于语言:有些语言与文化紧密相关,有些则不那么紧密。西班牙语是一个很好的例子。大约有 20 个国家说西班牙语,其中一些国家彼此之间差异很大。我们加入了一些文化元素,但我们尽量不做那种「哦,你在学习西班牙语。那么你是一个戴着阔边帽的墨西哥人」的事情。我们不能冒犯任何人。我们尽量加入一些文化元素,但这不是我们的主要目标。
Nilay Patel:我今天早上又去用了多邻国。我一直试图在学习印地语。有个疑问,多邻国是免费的,那这个应用程序是怎么赚钱的?
Luis von Ahn:确实是免费的。而且你的学习功能可以完全免费使用,无需支付任何费用。如果你不付费,你可能会看到一些广告,我们通过广告赚钱。但是,如果你想关闭广告,你也可以付费订阅,这样就可以关闭广告并获得一些额外功能。我们通过订阅赚钱,实际上,大部分收入来自订阅。
Nilay Patel:多邻国现在盈利吗?
Luis von Ahn:是的。不过也就是最近这段时间才开始的。
Nilay Patel:我对这个很好奇。我从几乎每个人那里都能听到这种故事:开始时,想要增长我们的用户基础,广告帮助我们做到这一点。它帮助我们保持产品免费。然后真正的收入将来自我们增加价值和增加付费订阅。但是最近,广告比以往任何时候都难以赚钱。你们的情况是否也是如此?
Luis von Ahn:这是真的。广告对我们来说从来都不是优先事项。我不知道确切的数字,但我们的收入中大概只有 6% 或 7% 来自广告。对于我们来说,广告的存在很大程度上只是一个让人们订阅的好理由。我们大约 80% 的收入来自订阅,尽管,顺便说一句,只有不到 10% 的月活跃用户付费订阅。所以 10% 的月活跃用户给我们超过 80% 的收入。
Nilay Patel:这里说的全都是语言教学吗?数学课能提供可观的增长吗?
Luis von Ahn:绝大部分都是语言教学,压倒性的。数学和音乐还在增长,但毕竟我们才推出一年,一切才刚起步。
Nilay Patel:我想到,你们最近推出的数学和音乐课程,只在 iOS 上有,Android 系统上还没有,而 Android 可是全球最普及的操作系统,大多数收入不高的人用的都是它。这看起来有点矛盾,好像多邻国最好的体验只在有钱人用的平台上。你打算怎么解决这个问题?
Luis von Ahn:这确实是个问题。首先,我们的数学和音乐课程很快就能在 Android 平台上使用了。我们通常在 Android 上的进度会比 iOS 晚大约一年。从多邻国一开始就几乎是这样。这其中有很多原因,但可能最大的原因是相比 iOS 开发者,找到真正优秀的 Android 开发者更难。
我们在 iOS 上试验大多数新功能。因为新功能一开始通常并不那么出色,你通常需要尝试和错误来努力改进它。等到它做好了,我们就把它移植到 Android 上。这就是我们的操作方式。
我们理解 Android 的重要性。使用 Android 手机的人比 iPhone 多。通常,所有功能最终都会出现在 Android 上,只是大约晚六个月,我们觉得这样没太大问题。
回顾过去,考虑到现在的技术,也许我们会做一些跨平台的开发,我们可以同时在所有平台上开发,但我们已经被锁定在两端都是原生应用的状态。我们有针对 iPhone 的原生应用,我们也有针对 Android 手机的原生应用。这是我们 10 年前能做的最好的事情,我们现在也被锁定在这种状态了。
Nilay Patel:当你考虑公司增长,支持多个平台,那基本上就是工作量翻倍。你有没有想过,「好吧,我们打算故意放慢开发速度,这样可以保持团队规模小一些」?
Luis von Ahn:确实有这个考虑,我们没有一个大项目会说我们停止所有开发,然后说,「你知道吗?我们现在要变成单一平台的东西。」但我们正在慢慢朝那个方向走。我不知道这要花多长时间。难处在于,如果我们现在从头开始,两端的统一会轻松很多,但现在你还得保持现有的这些东西。这样做的投入太大了,我们可能不得不停止所有开发一年半或更久。我甚至不知道具体时间表,因为这事太大了。到目前为止,我们决定一点一点来做,而不是一次性全做完。
Nilay Patel:你们的高级订阅层级,Max 层级,最近才在 Android 上推出。
Luis von Ahn:就在最近几天。
Nilay Patel:我从现代智能手机诞生以来就一遍又一遍听到,iOS 用户花钱更多。
Luis von Ahn:是的,多四倍。至少对于多邻国来说,一个 iOS 用户人均花费是 Android 的四倍。
Nilay Patel:所以你的大部分收入来自 iOS 用户?
Luis von Ahn:是的。我们从 iOS 用户那里得到的钱比从 Android 用户那里得到的多。尽管我们的 Android 用户比 iOS 用户多。这个 4 倍的差距很难弥补。
Nilay Patel:你是说 iOS 用户会有 4 倍的消费?还是你们总体上能从 IOS 用户那儿得到 4 倍的收入?
Luis von Ahn:一个用户花费是四倍。我给你一个数字,让你有个概念。用户比例是 3:2,也就是 60% 的 Android 用户,40% 的 iOS 用户。收入比例则是反过来的。基本上是 60% 来自 iOS,40% 来自 Android。这些是非常粗略的估计。
Nilay Patel:如果大多数用户都在 Android 上,Android 是世界上最大的操作系统,但你所有的钱都来自 iOS,你有没有考虑过扩张怎么办?你如何解决这种不平衡?只考虑在 iOS 上赚钱而不是 Android 吗?我们的主要任务是为所有这些人提供免费的语言教育,所以是 iOS 用户在给 Android 用户花钱?
Luis von Ahn:并不是说我们所有的钱都在 iOS 上。只是说更多的钱在 iOS 上。
但无论如何,如果你看看目前谁为多邻国付费,他们通常是生活富裕的人。他们可能不是百万富翁,但他们是生活在像美国这样富裕国家的人,这些国家有像每年 10 万美元这样的薪水。在富裕国家有一份稳定工作的人,那就是为多邻国付费的人。免费使用多邻国的人通常在贫穷国家。他们可能没有稳定的工作,所以确实我们是在让富裕的人补贴每个人的教育。就是这样,而且可能永远都会是这样。
现在,我们作为企业也需要变得更好,以便让更多这些发展中国家的人付费。一个很好的例子是,Netflix 在让巴西和印度的人付费方面做得非常好。我们做得没有那么好,部分问题是我们是免费增值模式。再说一次,我在贫穷的国家长大。即使价格降低到与人均 GDP 相匹配,便宜很多,但在贫穷国家的问题是,态度是,「除非必须,否则我不会付费。」这就是态度。不管是不是只是一美元,我确实有一美元。除非必须,否则我就是不会付费。
你看到的是对广告的极端容忍。例如,我们可以在课程结束时放 10 个广告,他们仍然不会付费。这就是为什么,例如,Netflix 在这些国家做得这么好,因为 Netflix 没有免费。他们就是说,「看,不管怎样,你必须付费。」人们就会说,「好吧,好吧。我会付费。」所以我们不得不想出作为免费增值产品在这些国家怎么办,我们有一些想法,但现实是,我们在像印度这样的国家并没有真正成功地实现很成功的商业化。
Nilay Patel:多邻国一直非常注重游戏化(gamification),你的首个项目,也就是你卖给 Google 的那个,就是一个游戏化的东西。你做了 reCAPTCHA,这本质上是以一种特定的方式游戏化训练数据。
多邻国的演变过程是这样的——你最初工作的重点是提高用户的参与度,让用户回到应用中,并且有角色的陪伴,然后底层内容是语言课程。几年前我刚开始使用多邻国时,我就在想,「哦,这非常熟悉。只不过这只鸟不会离开我,这就是为什么我又回来了。」现在你又在谈论这整个其他的功能和改变:我们要使用 AI;我们要有这些自然语言对话;我们要扩展到数学领域。
当你感觉到你正在从「我们正在游戏化这个非常熟悉的东西」转变,并使用这种新的参与机制到「现在这是一个全新的东西」时,是什么时候?
Luis von Ahn:从一开始,我们多邻国就坚信一个核心观点:自学时最难的事情是保持动力。实际上,这很可能是我们成功的最大原因,因为我们很早就意识到了这一点。从一开始,我们就致力于让这个应用变得让人喜欢,能让你不断回来。我们可能在这方面投入的努力比任何其他事情都要多。
在内部,我们觉得学习语言很像健身。你到底是在用椭圆机、Peloton 健身车还是跑步机,其实并不那么重要。最重要的是,你每天都在做,不管你在做什么。多邻国也是类似的。也许某些方法比其他方法更高效,但重要的是你每天都在做。我们在这方面做得非常好。一旦我们在这一点上做得很好,我们就开始尝试在我们教授的内容中加入更多的复杂性,并且我们在过去几年一直在这样做。但始终,我们想做的主要是一个动力引擎。
Nilay Patel:你认为游戏化与用户参与度——这些是你们一直以来成功的因素——和教育之间存在冲突吗?
Luis von Ahn:是的,确实存在。
Nilay Patel:你们怎么处理他们二者的冲突?
Luis von Ahn:很简单,永远选择参与度。
Nilay Patel:你肯定这这方面听过很多、想过很多,为什么最后做出这个决定?
Luis von Ahn:我可以说很多,但是归根到底我最认同的一句话就是:无论你的教学效率多高,你永远没法教一个没来上课的人。
Nilay Patel:就这样?
Luis von Ahn:就这样。因为人们会离开。实际上,参与度和学习效果并不总是相互冲突,只是当它们有冲突时,我们通常会优先选择参与度。
学习中很多事情会让人感到挫败,而挫败感会导致用户流失。
我举个例子,与其强迫你坐在那里,我能在五分钟内把内容教会你,但那五分钟可能会非常痛苦。我们不如在两个小时内慢慢教你——虽然慢得多,但整个过程会有动画在屏幕上呈现,你会不断获得多巴胺的反馈。虽然一个真正优秀的老师可以在五分钟内通过观察你的错误来教会你这些内容,但那会让人感到痛苦。我们更愿意让你留下来——而不是效率更高。
其中一个原因是我们是在应用程序环境中,而不是学校环境中。在学校里,孩子们实际上是被「困」在那里,他们不能随意离开。而在应用程序中,哪怕是最微小的挫折,人们都会说:「你知道吗?我现在去刷 TikTok 了。」我们不能失去这些用户。所以我们总是选择参与度,但这并不意味着我们不会教你这些内容,只是我们会慢慢来。
Nilay Patel:显然,你在这事上想过很多。
Luis von Ahn:这花了我们很多年才在这事上明确下来。
Nilay Patel:当你总是选择游戏化时,你失去了什么?
Luis von Ahn:大概是效率——我的意思是,单位时间内学到的内容量。事实是,我在第三世界长大,我小时候老师们在教我的时候会打我。我不是在开玩笑。他们真的会打我。现实是,我可能学得非常快,因为当你学习书法时,如果做错了,他们会用尺子打你。你真的有动力很快完成它。你会学得非常快。
所以我认为这是真的:如果你处于一个被迫学习的环境中,而且没人在乎你对此感觉如何,你可以学得更快。但在我们的情况下,只要你仍然参与其中,我可以接受稍微慢一点的学习。
Nilay Patel:我那时候也遇到过一些很严格的老师,但我在考试方面真的很在行。我和我妻子是大学同学。她比我聪明多了。
Luis von Ahn:但你很擅长考试。
Nilay Patel:她总是生我的气,因为我只需要最后出现然后参加考试就行。这可能就是她好几年都一直不跟我约会的原因,因为那种核心的挫败感。
人类老师可以评估你是擅长考试还是真的学到了东西。我刚才提到的权衡就是,如果一切都是游戏化和参与度,人们可能只是学会了玩游戏。他们可能什么也没学到。
Luis von Ahn:可能有一点吧。当然,这很难衡量。
但事实是,最终,它是有效的。多邻国是有效的。举我自己的例子,我过去几年一直在用多邻国学法语。到现在,我可以在没有字幕的情况下看法语的 Netflix 节目。我就是看,它有效。所以你是对的,可能存在权衡。这可能很难衡量。但我们主要是希望人们真的在好好利用他们的时间。
Nilay Patel:想问问你关于创始人模式的问题,但你自己就是创始人。你是如何保持对这一点的关注,而不是被其他事情分散注意力的?
Luis von Ahn:我确实在这样做。我确实投入了精力在这上面。但不仅仅是我,公司内部普遍理解,如果产品不好玩,那就不会有效果。我们投入了大量的努力让多邻国保持趣味性。这就是为什么,比如我们做了那个你可以和 AI 对话来练习语言的功能,你并不是在和随便一个 AI 对话;你是在和我们角色群中的一个角色对话。它有自己的个性。真的,我们做的每一件事,每次我们推出新功能,我们都会深入思考,「哦,这必须让人感到愉快。」我确实在推动这个议程,但我不需要花费太多精力,因为这已经在公司文化中根深蒂固了。
Nilay Patel:我从上市公司的 CEO 们那里听到的另一件事是,产品的质量很难量化,AI 产品更是如此。至少在目前的市场上,如果你说,「好吧,我们要在 AI 上投入一大笔钱,我们认为在这个用例中,这对我们将非常成功,或者我们可以为此收更多的钱,但我们不得不先花一大笔钱,我们得等到它变好」,这并不是对投资者的一个好故事。你现在是如何处理这个问题的?
Luis von Ahn:你说得对,质量确实不好量化。我们在做这方面决策的时候,尤其是设计部门,我们有非常注重质量的人。我们会说,「不行,这还不够好。」我们经常这么做。
至于投资,老实说,对于公开市场,我们不太讨论这些。我们讨论的是指标。我们不会太多讨论因为猫头鹰动画效果不满意,就多花了一个月的时间。我们不太讨论这些。我觉得这样挺好。但我猜如果我们在财报电话会议上花很多时间讨论我们花了多少精力去制作猫头鹰的动画,我不觉得人们会喜欢这个。
Nilay Patel:真心觉得所有公司都应该花更多时间谈论他们为做好产品而投入的时间。
Luis von Ahn:我非常认同这一点。事实是,我们确实花了大量的时间在这些细节上。如果你看我们的 app,随着时间的推移,我们变得越来越注重动画效果。我们花了很多时间研究动画的每一帧,常常会说,「看,这里还不够顺滑。」我不敢说我们的应用是完美的,但我们确实尽了最大的努力,力求做到尽善尽美。
Nilay Patel:一个难以衡量的指标,或者可能导致不同方向的指标,是多邻国的成功程度。也许最重要的指标是:人们是否真的学会了西班牙语?他们是否能在结束学习后流利地用西班牙语沟通?不仅仅是掌握语言,还能实际运用。你能衡量这一点吗?
Luis von Ahn:我们可以衡量,但评价的效率还比较低。
答案是:多邻国确实有效。我们目前所知道的唯一真正可靠的方式是:我们会找一个刚开始使用多邻国的人,给他们做一个测试来衡量他们的基础水平。然后让他们使用多邻国一段时间——因为学习一门语言需要不少时间,大约一年或两年。之后,我们会再次询问他们是否使用了其他教学资源,并给他们做个测试,看看他们进步了多少。结果显示,那些之前毫无基础且只使用多邻国而未使用其他资源的人,学习成果相当于或超过了在教室里学到的水平。当然,具体情况因研究而异,但我们对此很满意,结果确实有效。
问题在于,这种测量方式非常慢。我们需要一到两年的时间才能得到新的数据。但尽管我们尝试了很多次,也没能找到周期更短的方法。我们在应用程序里做过一些微测量,比如「你是否学会了这个单词」,但这些方式非常复杂,效果也不好。因此,我们仍依赖这种传统的方式。
Nilay Patel:人们很关注教育及其效果测量方式,比如我们如何衡量学校和教师的表现。你觉得自己在参与这个系统吗?你们也在用他们的测量方法,对吧?学校也是这样做的,他们通过考试来衡量。
Luis von Ahn:是的,我们确实在使用他们的测量方式,效果评估对我们来说非常重要。我们投入了大量精力,确保我们的教学是有效的。尽管评估周期以年为单位,但好消息是,多邻国的有效性是可以量化的。如果你看过去 10 年,每一年多邻国的教学效果都比前一年好,这是毋庸置疑的。
Nilay Patel:这是基于考试的衡量标准吗?更多人通过了考试?
Luis von Ahn:是的,更多人得到了更高的测试分数。基本上,每年使用多邻国的人都学到了更多内容。原因有很多,因为我们一直在努力改进教学方式。这绝对是真的。
现在,当我们和其他方式对比时,我们知道我们的效果至少和课堂教学一样好,甚至更好。但我们还没达到一对一真人导师的水平。我们的目标是在未来三到五年内达到这个标准。不过在让用户坚持使用方面,我们已经做得比一对一导师强很多。不过从效果上讲,如果你有足够的金钱和毅力,真人一对一导师的效果确实更好。
Nilay Patel:你觉得英语学习是你们的下一个核心增长点吗?
Luis von Ahn:当然,我们在这方面投入了很多努力。它正在增长,这是一个巨大的机会。我们最大的市场是美国这样的国家:富裕国家。但总的来说,从整个语言学习体系来说,最大的市场实际上是发展中国家:世界上的印度、越南、巴西和墨西哥。他们在学习英语,这是最大的语言学习市场,但我们还没有打开它。我们已经打开了较小的市场,也就是美国和西欧等富裕国家。还有很多国家,我们已经打开了他们市场——比如印度,他们只是不付钱给我们。
Nilay Patel:我们今天谈论了很多关于印度的事情。我们也谈论了很多关于新兴语言。你能在这个应用里加入古吉拉特语(Gujarātī)吗?这是我能像婴儿一样理解和说的语言,但我不能读写,我很想弥补这个缺陷。
Luis von Ahn:你在要求添加语言。这是个难题。
Nilay Patel:但说它的人不少。它可是甘地的母语。
Luis von Ahn:有一件非常不幸的事情,那就是大语种和想要学习它的意愿之间的差异。这两者之间有很大的不同。就印度语言而言,印地语可能是最大的,但学习它的人很少。我不知道确切的数字,但肯定低于我们总学习者的 1%,我猜我们的学习者中只有 0.1% 在学习印地语。这就是添加语言的难点,我们必须维护它们,我们必须做得非常好,但最终,我们就是没有得到很多使用。所以,对不起,我们加不了。我们考虑的是学习者的人数、而不是使用者的人数。
过去,我常常对这种事情说可以,我们在添加语言上犯了很多错误,事后看来,我们可能不应该添加那些语言。
Nilay Patel:你曾经砍掉过某种语言的课吗?
Luis von Ahn:有过。我想是南非语。部分原因是需求很少,但最大的原因是它只是一个质量很低的课程,我们觉得低质量的课比什么都更影响品牌形象。
Nilay Patel:你认为 AI 会帮助你添加语言吗?
Luis von Ahn:也许未来吧,但不是现在。目前,AI 对大语种真的很有用,但对小语种真的很糟糕。它与我们提供的语言有很强的相关性。AI 对我们有的语言:西班牙语和法语非常有效。它对世界语或纳瓦特尔语等小语种不是很有效。
Nilay Patel:AI 在数学方面众所周知地差,或者至少目前的 LLM 在数学方面做得不够好。它们在数学课上能帮助你吗?
Luis von Ahn:好消息是,至少对于我们来说,它可以提供相当大的帮助。我们为数学课程生成的很多数据都是用 AI 完成的。毕竟我们用的是计算机啊!计算机在数学方面还是很擅长的。
Nilay Patel:有趣的是,我问这个问题多少次,有人没有提出面前的是一台计算机的想法。我很高兴你提到了。
Luis von Ahn:计算机在数学方面很擅长!我理解 AI 在找规律或很多复杂问题上不是特别擅长。但我们为数学课程生成的数据很多都只是分数和乘法之类的东西。计算机在生成这类数据方面相当擅长。
Nilay Patel:说到疫情对我们工作模式的影响,还有一块就是大家出行的需求被压抑了。我有些朋友,看他们的 Instagram 就知道,已经两三年没来美国了。你们有没有吸引到那些喜欢边旅行边学语言的人?现在旅行热潮又回来了,这对你们的业务有影响么?
Luis von Ahn:旅行这事儿挺有意思的。现在我们公司上市了,人们就开始各种猜测我们的旅行业务。
他们会说,「旅行要开放了,这对多邻国可能是好事。」或者他们说,「旅游业不行了,这对多邻国可能是坏事。」但实际上,旅行对我们的影响没那么大。我们并没有看到旅行业务的起起落落对我们有多大影响。我们的学习者有很多不同的动机,但最大的两个动因并不包括旅行。
其中一个是爱好,这在美国是最大的一个群体。如果你问美国人为什么使用多邻国,最常见的回答是,「嗯,我以前经常玩 Candy Crush 或者刷 Instagram,现在我用多邻国,至少我还能学点西班牙语。这只是个爱好。」
另一大群体是学习英语的人。对他们来说,这不是为了旅行。他们只是需要学习英语,无论是为了教育机会还是工作机会。这两大群体占了我们用户的 90-95%。至于旅行对它的影响真的不大。
Nilay Patel:想问问你关于猫头鹰这个图标和吉祥物的事。至少在美国,猫头鹰是非常有文化定义的角色。如果你把猫头鹰带出美国社交网络,放到其他地方,它就没有意义了。猫头鹰在不同市场有没有文化上的表达,还是只有一只猫头鹰?
Luis von Ahn:我不知道该怎么回答这个问题。它介于两者之间。
不过总之我们学会了如何针对不同市场进行本地化。所以我们开始为很多国家开设多邻国账户:墨西哥、日本、巴西、德国、法国、中国……我们已经知道如何让它们都能成功。当有人告诉我我们要在德国开账户时,我最初是怀疑的。不是对德国人不敬,但我当时想,「这些人没有幽默感。」不过事实上他们有。实际上,德国我们投放最成功的国家之一。国际用户和美国用户相比有点不同,但也不是那么不同。
Nilay Patel:你们是怎么安排这些全球化团队的?
Luis von Ahn:我们有一个「全球团队」,就五个人。然后在每个国家,我们又有一小拨人,可能一两个人,负责本地化这些内容。
而「本地化」并不意味着我们把完全相同的视频在墨西哥就加上一个墨西哥草帽。不是这样的。我们有主题,我们已经知道哪些主题在全球范围内有效,以及哪些主题在某些国家有效。比如,德国的账户,我们在啤酒节上搞了一个大活动。还有,因为柏林有这种舞厅场景,我猜他们都去了其中一个 24 小时舞厅。每个国家都做不同的事情,而且效果非常好。
Nilay Patel:如何挑选多邻国本地化成员?你是不是就是看看人们的推特账户,然后说,「你足够疯,可以来做这个」?
Luis von Ahn:现在很大程度上还真就是这样,因为我们在网上的存在感很强。顺便说一下,直到最近我才知道,有时候我们的视频能登上 TikTok 本周热榜。因为我们的社交账户非常知名,所以我们在招聘方面有很多选择,很多人想加入我们的团队。我们会看看他们以前做过什么。通常,这些人非常有趣。
Nilay Patel:所以通过你们的社交媒体,真的吸引到了很多新用户吗?
Luis von Ahn:是的。顺便说一下,我们没花过钱搞社交媒体营销。我们做点视频,然后它们就病毒式传播了。大约有 15% 的用户是从社交媒体来的。现在,如果你看看我们内容的社交媒体浏览量,几乎以数十亿计。而且其他用户的同人二创数量,几乎和社交媒体上我们自己发布的内容一样多。
Nilay Patel:你有没有告诉推广团队要刹车?你有没有看过他们做的一些东西,然后说,「我们不能这么做」?
Luis von Ahn:是的。我们有审查。有一个审批流程。实际上我们曾经也越过界限发布过一些不应该发布的内容,于是就搞出了审批流程。这是一个完整的层级,最后一步基本上是我。但是东西不常送到我这里,因为我前面有人,比如 CMO。
Nilay Patel:最后一个他们想说服你去做的,但你持怀疑态度的是什么视频?
Luis von Ahn:我不记得确切的视频是什么了,但确实会有我最后同意发布后又感到后悔的内容。我还记得大约一年前。我们制作了一个疯狂的视频。它太疯狂了。我们对它有点犹豫,最后还是放弃了它。你知道的,网上有很多关于猫头鹰真的想让你学习语言的梗,它不择手段,包括绑架你的家人。那是一个玩这些绑架梗的视频,我们对它有点犹豫,然后发生了巴以冲突的一些袭击事件,当时发布这种视频有点太敏感了,我们放弃了它。以后估计也不会再拿出来发了。
Nilay Patel:我们谈到了潜在需求。人们来多邻国是为了什么?然后是增长问题,就是「我们怎么去创造需求?」当你思考公司架构时,会不会有「我们得去做市场营销来推动旅行需求」这样的想法?还是说,你根本不会这么考虑?
Luis von Ahn:不会。在我们市场营销这方面,我们从没这么想过。我们有 90% 的用户是靠口碑吸引来的,我想这种情况会继续下去。
我们在市场营销上的投入相对较少。我们全球的营销预算总共也就 5000 万美元一年,对于一家像我们这样收入规模的公司来说,这个预算相当少。但我们的营销策略似乎效果不错,我们并没有在这方面花很多钱。
Nilay Patel:可以介绍一下公司的组织架构吗?
Luis von Ahn:我们有好几个职能部门。有市场部、工程部、产品管理部门、设计部等等。每个部门都有负责人。工程、产品管理和设计加起来占了我们员工总数的大约 70%。设计部门对于我们公司来说异常庞大。我们总共有 850 名员工,但设计部门就有大约 130 人。
这些都是负责产品的人。如果你看这个团队,它被分成了几个区域,每个区域都与我们试图优化的某一方面相关。例如,在语言学习方面,我们试图优化的三件主要事情是:参与度(也就是多邻国有多有趣)、更好的教学、以及我们赚了多少钱。我们为每一件事都划一个区域。然后,每个区域都有团队,每个团队都有人。它的结构有点像矩阵。
我认为对我们来说效果很好的一个重要事情——不过这并不容易做到——就是我们的区域和团队不是基于功能的。我的意思是,大多数软件或应用公司通常都有一个团队负责一个功能。比如,这是登录团队,负责登录。或者如果你有一个排行榜,这就是排行榜团队,他们负责排行榜。我们不是这样的。
我们的团队不拥有功能。我们的团队拥有指标。我们有一个团队负责订阅收入。我们有一个团队负责日活跃用户。他们可以随意修改应用中的任何东西。他们所要做的就是不断提高指标。这样做有好处,就是与指标非常一致。也有不好的地方,就是没有团队拥有某些功能。当出现问题时,很多人会说,「这不是我的职责。我不知道。」有好有坏,但总的来说,这对我们来说确实效果很好。
Nilay Patel:然后,当两个人试图改变某件事情以不同方向提高两个不同的指标时,你将不可避免地遇到冲突。你是如何解决这些冲突的?
Luis von Ahn:确实会有冲突。有几件事情帮助我们解决这些问题。一是,对应用的每一次更改都要通过一个叫做产品审查的审查过程,这不是一个人的事情。有一群人对整个系统的运作有很深的了解。他们有点像是把关人,有点像是说,「不,你不应该那么做」。
另一件非常重要的事情是我们有防护性指标。就是这么回事:如果你在那个试图提高订阅收入的团队,你的目标就是提高那个指标。但我们告诉你,「你不能搞砸其他任何指标。」例如,如果你做了一个实验,提高了订阅收入一百万美元,但它减少了日活跃用户,你就不能推出它。这真的帮助团队自我约束。他们至少不会去做任何真正搞砸其他事情。这两件事情的结合帮助了我们。
如果我们有十万员工,我认为这种结构就不会有效。也就是说,我不认为像多邻国这样的公司,至少对于我们拥有的产品,需要十万员工。我认为我们会增长,我们会继续增长。也许我们会达到 5000 名员工,但不会有像十万员工这样的情况。
Nilay Patel:这些冲突有多频繁会呈到你这?你有多频繁需要做出权衡?
Luis von Ahn:没那么频繁。团队自己会进行很多自我约束。我确实会看到应用中的每一次更改。我确实会看到这些,但通常,我不是在做权衡决定。我主要关注的是确保一切都有高质量。
Nilay Patel:你们内部是怎么做决策的?框架是什么?
Luis von Ahn:对于公司来说,决策很大程度上与投资回报率挂钩。在大多数事情上,都有一个投资回报率的计算。这推动了我们大多数的决策。
另一件事就是,当你做一个项目时,有三件事很重要:它要花多少钱?你要多快完成?以及质量如何?通常这些东西之间有权衡。在多邻国,最重要的是质量,第二重要的是速度,第三重要的是我们是否在预算内。在许多公司,顺序是相反的,最重要的是预算,然后是速度,再然后是质量。在这里,质量是最重要的。所以这也是我们决策的另一个组成部分。
对于我个人来说,我的决策非常依赖直觉,我会说,「听着,这就是我认为我们应该做的。我可以告诉你一些我事后可能想出的理由,但现在我的直觉在说我们应该这么做。」因为我已经在多邻国工作了 13 年,我的直觉相当好。它确实不是 100% 正确,我也会犯错,但它已经足够好。我主要根据直觉做决定,然后我事后告诉人们理由。但我身边的人都知道这些理由是事后想出来的。它们并不是理性思考。
Nilay Patel:这种方式对一家初创公司的创始人或私企的 CEO 是有效的。但多邻国已经上市三年了。作为上市公司的 CEO,这种方法对你还有效吗?
Luis von Ahn:有效。我不得不做的大多数决策,都有一个明确的答案。就像,「好吧,看,这样做会让我们亏钱。我们不要这么做。
文章来自于“Founder Park”,作者“Founder Park”。