BAI、高瓴领投,ThetaWave李文轩:我们想成为下一代年轻人默认的知识获取入口

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
BAI、高瓴领投,ThetaWave李文轩:我们想成为下一代年轻人默认的知识获取入口
5220点击    2026-01-29 11:01

AI-Native 知识内容平台 ThetaWave AI 宣布近日完成数百万美金的 Pre-A 轮融资,BAI Capital、高瓴创投及 MBA Fund 联合投资,老股东奇绩创坛跟投。


ThetaWave AI 在 2025 年下半年突破一百万美元 ARR,目前现金流收入已能覆盖公司开支,用户次月留存 80%+三月留存 65%+。


不管怎么看,ThetaWave AI 都属于已经找到了 PMF,并且跑通了增长闭环的「优等生」产品了。


创始人李文轩大一辍学创业,ThetaWave AI 算是他的第三款产品,对于他来说,一直关注的都是「AI 带来的无限个性化内容供给的可能性」。而 ThetaWave AI 未来想做的,是想成为「每个人默认的获取知识的入口」,成为「第一个能够定义好新一代内容平台生产和消费方式的公司」。


以下是 Founder Park 与 ThetaWave AI 创始人李文轩的对话,经编辑整理。


体验产品:https://thetawave.ai/


01 

创业方向:想做的、能做的、可做的,

三件事的交集


Founder Park:这是你的第一次创业吗?简单介绍下之前的创业经历。


李文轩:严格意义上来讲,这是第一次。公司一直是同一家公司,但中间换过一些方向。


先从最早的经历说起,我跟合伙人在高中时期一起做过一个自闭症儿童使用的 AI 情绪监测手环,用 AI 提前预测他们的情绪变动,这个源自我们在盲童福利院做义工的经历。这个项目最后在北京周边的 6 个连锁福利院「爱百福」都有推广。是个公益项目,没有走商业化,还被《人民日报》报道过。高中期间其实还折腾了很多项目,我们做了一套系统,通过 AI 去评估同学们在家做体育运动时动作是否标准,也算是个小创业。


后来我去了伯克利上大学,期间也一直在朋友的创业公司里做过不同的工作。大一暑假,我正式决定出来 all in AI 创业,拿到了第一笔投资。


不过公司一直都是这家,中间做过两个其他的方向。


一个是 AI 口语 tutor,帮助需要准备口语考试的人做模考,跟外国人一起去练习真实的口语。


另一个是面向校内老师的 AI 解决方案,包括试卷生成、教案生成、测试题生成这些场景,是个 SaaS。到 2024 年下半年,才开始全心做现在 ThetaWave AI 的方向。


Founder Park:这两个方向也做出了一定的效果,当时为什么没做下去?


李文轩:我们一直在寻找「想做的」、「能做的」和「可做的」这三件事情的交集。


口语方向,它可能满足了「想做的」和「能做的」,但在「可做的」这个层面,我们当时没有特别思考竞争和差异化,也没思考自己的比较优势,当时在做的时候,同期就有新东方、有道或者海外一些比较成熟的公司都在做类似的事情。


我们觉得这个方向的可做性没有那么强,第一是卷,第二是最初的出发点不是观察到这个赛道有问题,而是这个赛道本身有需求,但我们没有去调研其他人的解决方案都有什么问题,「可做的」层面的圈没有画得很清楚。


SaaS 方向,它恰好是「能做」且「可做」,但不是我们特别「想做的」。


SaaS 是销售驱动,对于我们这样一个相对年轻、技术向的团队来说,不是那么擅长,也不是那么感兴趣。但它本身在商业上是可行的,我们也服务了一些用户,单位经济模型可以跑通,但它确实没有那么适合我们团队来做,所以我们最后主动放弃了。


Founder Park:那你们当时是怎么用这三个维度来看现在的产品方向?


李文轩:我们「想做的」事情其实一直没变,我们认为 AI 带来的一个巨大机会就是无限个性化内容供给的可能性,之前的三个方向其实都在这个区间内。第一个方向是从老师的资源角度去解决这个问题,现在我们做的事情是直接从学生侧的知识输入场景去解决这个问题。方向一直在「想做的」这个圈子里。


「能做的」维度上,我们当时觉得文本和图片模态已经到了一个比较不错的、能做的区间。因为有些我们想做的事情,比如视频模态,我们觉得还不够成熟,所以暂时还没做。


「可做的」维度上,是我们观察到,在微观层面,用户有很痛的点和很强的付费意愿;宏观层面,没有太多产品在帮助用户做个性化的、被动的知识输入和理解。当时很多产品是去解决「当你有一个问题,怎么得到个性化的解答」,但很少有人去帮你更好地看懂一本书,或者更快速地理解一个文档。所以当时我们觉得这个方向也是可做的。


Founder Park:哪些指标证明你们找到了产品的 PMF?


李文轩:最开始发现这个场景,是因为我自己在读大学的时候就有这个需求。大学期间在各种创业公司里折腾,课内的考试有时候会临时抱佛脚,但我没在这门课上投入那么多时间。当时我自己的解决方案,就是去找一个学霸朋友,问他整理好的笔记或者资料能不能借我看一下。


但当时的痛点是,不是每个人都有一个学霸朋友。我们就想:AI 能不能像学霸朋友一样帮我整理知识,生成一套我可以快速理解和消化的资料?这是微观层面的逻辑。


在宏观层面,我们还做了广泛的调研。聊了很多大学生,发现有些平台上有大量的学生购买笔记的交易,甚至看到一份笔记能卖到 100 美金甚至 200 美金,所以在做产品之前,需求层面就已经得到了初步验证。


产品做起来之后就比较快了。从第一次上线到有前十个付费用户,中间只用了可能两到三周。


很多早期的 PMF 验证,是通过我们团队自己的使用和内部需求验证就已经基本搞定了。上线后做了一些微调,调整了定价之后就基本确定了。


最早期的核心指标就是看有没有人付费,因为我们觉得对于 AI 产品来说,付费是最核心的指标之一。


Founder Park:为什么专注在知识的「输入」上,不去做一些帮助用户更好地「输出」的东西?


李文轩:也不是说不做,只是我们早期看这个市场的时候,觉得在「输入」这个地方能做出差异化。「输出」也做了,产品里允许用户提问并得到个性化解答,可以刷题、看闪卡等等,这些都是输出。


但我认为,学生在「输出」上的痛点,远没有「输入」大。当然这也分学科,一些理工科,特别是数学或纯物理,需要大量地练习。除了这些学科以外,像文、商、法、医等学科,都是靠对知识的理解和记忆。你需要记下来并且理解它,能融会贯通。对这一类学科来说,被动输入就是更痛的点。


当时我们看到市场上,前者(输出)有很多公司在解决,比如 GPT 解决得还可以。但是后者(输入)其实没有什么人在做,当时我们觉得这是个很大的机会。


而且这也更能对应我们长期的愿景。我们最终是希望用户能在这个平台上看到最适合他的内容,这个行为本质上是一个输入行为。虽然他肯定有第二步、第三步的交互,但第一步的输入还是最核心的行为。


02 

TikTok 和 Instagram 是最有效的获客渠道 


Founder Park:产品的核心人群画像是什么样的?


李文轩:早期第一波用户是在海外的中国留学生,但后面大部分用户就是本土学生了,特别是大学生。


比较典型的画像,其实就是在欧美大学教育体系里,想有一个还看得过去的 GPA,但又不怎么爱学习、会学习的那一类学生,这类学生在大学生群体里反倒是主流。


说得再直白一点,这类学生就是:他没有摆烂,但又没有那么强的学习动力。本质上他对成绩有要求,但又不想自己付出那么多精力或时间去把这个东西学得特别好。


Founder Park:现在整体用户量和付费情况怎么样?


李文轩:最近摸通了新的国家市场的增长方式,每天都有几千名新增注册用户,月活突破了 10 万


付费层面的数据表现也不错,2025 年下半年突破了 100 万美金的 ARR。


付费率一直稳定在 5% 到 7% 之间波动,因为不同市场的付费率不一样,所以用户构成也不是完全一样。现在活跃用户里大概百分之四十几是免费用户,百分之六十几是付费用户,还是有一部分人是一直在免费状态留存的。


付费留存方面,次月一直在 80% 以上,第 3 个月在 65% 以上。整个付费数据在 C 端的 AI 应用里是比较不错的。


Founder Park:如何获得第一批种子用户的?


李文轩:最早期的种子用户其实就是我们身边在上大学的朋友们,或者是在社交媒体平台上认识的一些对这个想法感兴趣的用户。


第一波比较显著的、有付费的增长,是合伙人当时拉到的一个早期用户,他恰巧是一个小红书上的小网红。他在小红书上介绍了一下自己是怎么用这款产品。当时那条视频一天就引来了几千个用户。这也是我们后期大力做社媒增长营销的一个核心原因,UGC 的社媒有极强的价值。


Founder Park:这半年来你们主要的获客方式是哪些渠道?


李文轩:我们特别认可:营销的未来一定要做 UGC 内容,一定要让真实的用户在真实的场景下,真实地介绍你的产品。通过 TikTok、Instagram,甚至国内的小红书,它们的算法本质上就是想去筛选出好的内容,并分发给更多的用户。


当然,在实操层面我们也会做大量工作,我们管它叫「全球社媒营销 UGC 矩阵」,现在我们管理的就有 300 多个矩阵账号,还有大量的合作 KOC 和 KOL,所以我们每个月基本都能以非常低的成本拿到上亿的流量。


现在主要做的是 TikTok 和 Instagram,因为 TikTok 最核心的活跃用户就是北美的大学生。全球有 3 亿大学生,北美有 2000 多万。


Founder Park:你们是怎么解决本地化这个问题的?


李文轩:这就是 UGC 矩阵要解决的问题:怎么有效地组织起不同地区、不同国家的人,让他能够在社媒平台上都做出爆款。


比如我们要去打一个新的市场,肯定会去找当地的 KOL、KOC,他最好真的是我们的用户,能理解我们的产品,最好也是个大学生,看下他怎么介绍我们的产品,再把我们原本的爆款思路和背后的框架,套在他这一套本地化的「皮」上面。


每个国家社媒上的一些风潮、调性、审美是很不一样的。只是把同样的内容翻译成另一个语言版本,找个当地人来拍,肯定不会火。不是语言问题,是你的内容有没有对上当地人的审美。


Founder Park:为什么选择大学生这个群体做切入,未来打算面向大众做产品吗?


李文轩:学生当下最核心的目标就是通过考试,但这一群人未来就是所谓的大众。他们下一步有什么样的需求,我们就可以伴随着他们去持续满足需求。


比如他要进入职场,那下一步就是求职、升职加薪、自我提升,这就是我们下一步要做的内容和相应的工具。可能到一定阶段,他又有一些兴趣类、阅读类或个人爱好类的需求,我们也可以帮他更好地满足兴趣。


我们的路径就是:伴随着这一波人,在他特定阶段去服务他特定的知识需求。反过来,做这件事的时候又会给我们的平台带来新的用户,这些新用户又能消费平台上已有的内容。


我们希望通过内容的泛化和人群的泛化去不断扩充群体。最终的愿景,不管是应试、兴趣、职场需求,还是是个人长期价值感的知识获取需求,都能在这一个产品上闭环。平台上未来会聚集学生、白领,甚至中老年人,他们其实对兴趣内容都有需求,这个适合放在等我们有了一定的泛用户群体之后再去做,ROI 会更高。


03 

核心是帮助用户更高效地学习,即「少学」


Founder Park:在你看来,产品现在最能留住用户或者最让用户愿意付费的核心功能是哪个?


李文轩:目前最核心的交互流程,就是学生用户有大量需要看的资料,他可以无脑地拖入,比如 10 个几百兆的文档,AI 会去分析并结构化内部的知识,总结成一个知识图谱,然后再用各种各样的 Agentic workflow 去生成像图文笔记、思维导图、信息图、题库、闪卡、播客、讲解视频等一系列学习资料。


核心交互流就是「拖入-整理-生成」这三个步骤,用户得到正反馈的时间非常非常快。


此外,还有一个场景是实时的笔记纪要。我们为学生场景做了一些额外的优化,我们做了一个学生与 AI 在课堂上一起听课的场景,然后根据课程的上下文去补全笔记。用户可以在实时记录的过程中去写,这是一个思考沉淀的过程,更有助于他理解。长期来看,我们觉得这个功能很重要,因为它也是一个知识输入的入口,这样我们就把两个入口都占住了:一个是他把学习的文档文件拖进来,另一个就是他在课上的一些知识输入。


BAI、高瓴领投,ThetaWave李文轩:我们想成为下一代年轻人默认的知识获取入口


Founder Park:这个交互是不是有点类似于 Granola?配合用户一起做笔记,但以用户自己做的为主,再配合用户的笔记做一些 AI 的填充和重点标注。


李文轩:Granola 的交互是,用户在开会的时候手上也可以记一些东西,然后在会议结束后,把 AI 听到的内容和用户总结的结合起来,生成一份笔记。但你会发现,AI 生成的笔记是在会后才有的。我们的产品是希望做到实时,因为学生有的时候会走神,或者没听懂老师在说什么。


Founder Park:早期版本的功能和你们一开始的规划相比,有大的变化吗?


李文轩:有的。当时对用户心智有一个核心假设:用户可能会对标一些知识管理赛道的产品,比如 Notion。但后来我们逐渐偏离了笔记软件或知识管理类软件的范畴。


我们发现,用这个产品的用户大多是想省时间,或者说是想「少学」;而那一类产品更多是帮他学得更深、更好,是一个「多学」的产品。在心智层面是完全相反的。


所以我们在之后的版本都更加强调:我们本质上是给用户一个好的内容,这个内容用户看完的时间越短,就证明这个东西越好。


Founder Park:有没有一些功能,是你们觉得这个群体可能也需要,但最后砍掉了?或者用户一直想让你们做,但你们一直没做的?


李文轩:一类是用户有需求但我们一直没做的。我们听到比较多的,像帮用户写论文、找引用、降 AI 率这些功能。这些功能做进去肯定能让整体的收入和用户满意度提高,但我们的原则还是希望帮助用户更好地理解知识,而不是替代他学习或者作弊。


第二类是我们做了,但是上线后数据不好。比如我们之前尝试过一些游戏化的学习,把同一个文档变成一个可玩性更强的互动式游戏。但是做出来之后发现,用户的满意度和采用率都没有预期的那么好。


我们后来分析,其实是一个产品心智层面的问题。我们的产品是帮他快速搞定学习,本质上是让他「少学习」,但游戏化学习这类产品的心智是「我想学得更好、更深」,是一个「多学」的心智。这两个心智显然是冲突的。


Founder Park:所以你们的核心是帮助那些不管因为什么原因都想学习的人高效地学习?


李文轩:对。当然,不是说游戏化学习就普适性地不好,它跟我们解决的用户场景很相关。


我们对这个问题的理解是:获取知识是一个人一辈子都有的长期需求。


在学生时代,那可能就是高效,因为我不想投入过多时间去学习,还有更多顺人性的事情想去做,那核心出发点就是让他快速搞定、快速掌握。但比如在兴趣层面或者探索角度,他就是想得到一些正反馈等类似场景,游戏化学习方法就很合适。游戏化的交互呈现方式也在我们长期要做的范围里,但是短期内在目前这个切刚需的场景上,不会上这个功能。


Founder Park:听下来,你们和多邻国带给人的感受完全不同,多邻国想让用户有趣的学习。你们对「学习」这个词的第一性原理定义是什么?


李文轩:对,学习本身是一个行为,不是一个结果。行为本身很难定义,我们更聚焦在服务用户当下的学习行为,他要的结果到底是什么。


从第一性原理出发,我们认为学习或者说知识的本质,是获取服务于用户当下目标,或者对用户当下有意义的一些信息。


从指标层面来看,比如现在这个产品就是看用户能在多短的时间内 get 到考试所需要记住的信息,或者说,如果我们有办法测算他的考试结果,那就是对于他想通过的这个考试,我们帮他提了多少分,或者帮他节省了多少时间。这可能就是我们在当下的备考应试场景下,对「学习」这件事的量化结果的一个定义。


但是像多邻国,它肯定不是一个应试型的产品。从刚才讲的第一性原理来看,对于多邻国来讲,它更多是兴趣,加上一点社交或者说类似于打发时间的属性,想在比较轻松的状态下做一件有意义的事情。像留存、粘性、长期使用习惯和社交分享价值这些指标会更加合适。


04 

用户的行为反馈是提升产品能力的有效飞轮


Founder Park:一上来就面对全球 50+ 地区的用户,在本地化上有没有什么「坑」?


李文轩:本地化是我们花了不少功夫去优化的一点。像欧美或其他不同地区,本质上需求是一样的,但是翻译成产品上的语言、提供给用户的功能,都会有比较大的差别。我们花了不少时间去跟一些非英语地区国家的人直接沟通,为此我跟合伙人也在用多邻国学习中英以外的语言,比如我们最近在做西班牙市场,就在学西班牙语。


做这件事情有很多方式,我们目前看到比较好的方式是:第一,在语言层面不能完全依赖翻译。做产品和做策略的人,自己需要先有一个基础的认知;第二,在有语言基础后,需要跟用户做比较多的面对面交流。很多本地化不是一个翻译问题,更多是一个情绪问题。同一个人在不同文化背景下看到同一个东西,情绪反应是不一样的。


比如说付费墙,把它翻译成中文、英文和西班牙文,虽然都可以写「某个特定功能是否可用」,但是如何去形容这些功能,有时候会对付费率产生影响。当时我们想形容付费用户可以用到更高级的模型如 GPT-5.2,最开始用比较老土的翻译软件直接去翻,可能就翻译成「高级模型」,但「低级模型」就有点「弱智模型」的感觉,这种词听上去很怪。后来我们在本地化层面去了解,比如 OpenAI 是怎么在自己的付费墙里形容自己的模型更好?OpenAI 用的是「更智能」这个词。


Founder Park:对于现在的 chatbot 类产品,你们在做对话框和 GUI 的结合上,有哪些心得感受?


李文轩:自然语言交互和传统的图形界面,在不同场景下一定是有优劣势的。


我觉得 AI 应用很本质的一个价值是:在用户意图不明确的时候,通过一些手段去拿到用户自己都不知道的意图。因为从理论上来说,所有 AI 应用的价值都可以通过用户不断地跟模型交互、调试来实现。


在这个产品的场景下,我们会更强调图形化或者结构化的界面。因为在知识获取这个场景,结构化或视觉为主的信息要比自然语言更有效率,而且能更好地让他获得他本来无法表达的意图。


举个例子,如果是一个对话式交互,给用户一段内容,用户是很难特别精确地表达哪一段看懂了,哪段没看懂。但现在我们使用的是类似富文本的交互,用户可以选中任何段落,做任何操作,这样我们就能获得用户更多的意图。对于我们长期做个性化、用户短期得到反馈,都会更有利。


BAI、高瓴领投,ThetaWave李文轩:我们想成为下一代年轻人默认的知识获取入口


Founder Park:你们的产品交互有做过大的交互调整吗?


李文轩:大的结构上调整不多,是一个渐进式的迭代。最早期产品是只能看,不太能交互。后来逐渐加上可以跟生成出来的内容做各种各样的交互,比如编辑、扩写、溯源、生图、跟 AI 对话、修改笔记等等。


有一点很有价值。当下来看,更多的是用户的可控性变强了,但长期来看,我们拿到的是一个类似用户意图的对齐数据。比如,我们生成出来一个笔记,用户把这里删了,把那里扩写了,调整到了一个可用的状态,这其实意味着,我们下一次就应该直接生成那个样子。对我们来讲,这是一个可用的数据飞轮,我们能越来越逼近他的意图。


Founder Park:这套流程现在已经应用到产品中了吗?


李文轩:已经在了。我们其实对每个用户都有一个个人的知识库。每一次生成,我们都会让模型在合适的地方去参考,要不要调用这个工具去了解这个用户。


举个例子。我们生成一套题的时候,我们已经知道关于这个笔记有 10 个考点,他已经做过了 3 道题,那我接下来生成的 7 道题就不会再生成关于前面那 3 个考点了,但是如果前 3 道里有 1 道他之前答错了,我们就会着重地再去生成那 1 道相关的题。


Founder Park:学生上传的讲座、学术 PDF 这些垂直领域的数据,对产品有数据飞轮的效果吗?


李文轩:有。我们产品最近刚推出了社区功能,可以把一些用户允许公开的资料放在社区内,推送给可能同样感兴趣的同学。这个社区长期做下去,它的壁垒或飞轮会非常明显。举个最极端的例子,一个大学里每节课只要一个人去上,剩下的人只通过这个平台就能搞定这节课。


这个「内容飞轮」是我们最核心、最在意的飞轮。我们对自己的定义一直是新一代的内容平台,而不是一个效率工具,所以最核心的壁垒就是我们能聚集起来的内容生态。


后面也会做更多传统意义上的内容运营,比如去激励创作者,去定位社区用户到底需要什么样的内容和交互。但我们这里的内容定义和载体,必须是依赖于 AI 才能实现的,不然上一代内容平台就已经能做了。正是因为 AI 的个性化能力,我们才能做新一代的内容平台。


Founder Park:这种内容聚集,最终是像 Canva 模板一样,还是说,最终是通向一个用户可以学到任何想学的东西的内容储备库?


李文轩:我觉得这两者本质上是一件事。比如我现在要考 CFA,可能有一套公认最好的学习路径,这是那个 60 分的路径,但是从 60 分到 90 分,必须需要一套基于 AI 的可交互媒介,才能完成知识理解的闭环。这件事情就是我们这个工具在做的价值。


所以,我们长期在做的,第一是积累前面那些 60 分的东西,因为这确实是领域数据,比如 ChatGPT 现在也不知道伯克利某一节课喜欢考什么知识点。第二,它确实可以用来获客。因为对于知识理解的需求,大家最终要的还是一个足够好、足够适合我的内容。


既然用户是奔着内容来了,那就证明他是想在这上面消费这个内容。


05 

AI 产品本质上,

都是特定场景下模型能力的更好分发渠道


Founder Park:怎么看待你们和 NotebookLM 的差异?


李文轩:我们聊过很多用户,没有太多人认为我们和 NotebookLM 是直接竞品。虽然乍一看功能上有些相似,但 NotebookLM 的产品设计理念是为研究和生成做优化,比如对大量文档做查询、对话,或生成研究报告等场景。


我们一直关注的是,生成的内容能不能帮用户更好地理解,生成之后还有大量的 follow up 功能,让用户能完成整个知识理解的闭环。


单说在笔记生成方面,很明显一个是研究工具导向的笔记,一个是真的能让你理解、让你快速搞定考试的学习导向的笔记。而且 NotebookLM 生成出来之后就放在那了,没法编辑、修改,也没法做第二步的出题等功能,但我们把这些都做成了一个流线化的流程。


我觉得 NotebookLM 是一个想覆盖泛人群的产品,所以在里面做了一些有学习场景的功能,但我们就是一个为知识获取这件事做优化的产品,本质上有很大的不同。


长期来看,我们想做的是一种新的内容载体和对应的内容平台。而 NotebookLM 长期可能还是想做谷歌工具矩阵下的一个更好的工具。越往长期看,分化会越明显。


Founder Park:和竞品相比,你们的优势是什么?


李文轩:竞品在所有赛道都会有,而且现在 AI 应用的边界比较模糊,大家都会有一些交叉点。


现在市场远远没有到饱和期,我们和竞品触达的新用户,大概率都还没听过对方的产品。从竞争角度来看,目前还是一个抢市场、抢心智的阶段。


不过,从体验、留存和付费数据来看,我们的产品还是比绝大部分我们知道的竞品都要好很多。很多竞品可能是源于一些海外的学生团队,但他们在工程化能力和内容矩阵的运营能力上,比不过我们团队。


Founder Park:如果有竞品学习你们的打法,也去 TikTok 等平台获客,你们具备先发优势吗?


李文轩:先发优势是一部分。比如,一个博主肯定更愿意跟更有背书或规模的产品合作,但更本质的,还是我们自己的 taste。


比如在做内容矩阵上,就算我们现在把公司所有的 SOP 文档都开源出来,只有很少的团队能复制得很好。因为这里面有大量的 taste,你怎么知道这个内容会爆?你怎么觉得这个人有「网感」?这就像你们做媒体的人,你怎么知道这篇稿件容易爆?这就是一个 taste。


我们团队在这方面做得更好,因为我们是 AI 创业团队里最年轻的团队之一,又是年轻团队里最能做好 AI 产品的,这是我们的一个长期竞争优势。


Founder Park:你认为你们在模型 API 之上,构建了哪些只有你们能做的技术家或者业务逻辑?


李文轩:短期来看,我们的产品本质上是特定场景下模型能力的更好分发渠道。就像我刚才说的,没有什么事情是用户通过不断地 prompting 模型做不到的。但我们做的事情是把触达模型能力的门槛从 70 分降到了 10 分,这样的入口是很有价值的。


用户意图越不明确的时候,AI 应用就越有价值。用户的意图越明确,就越可以通过 prompting 去实现自己想实现的功能。用户的意图大概就是「我想快速搞懂这个,通过考试」,但他真正跟模型说的时候,可能就是说「给我生成个我能看懂的笔记」,模型怎么知道你能看懂的笔记是什么样?我们做的事情就是帮他把这个意图和个性化需要去 prompting 的很多事情都搞定了。


长期来看,我们更看重的是个人的上下文和模型还没有的领域的内容,这两样东西我们有,模型没有。所以,模型本身能力的提升,对我们来说就是个更好的补充。


Founder Park:现在产品的能力跟模型是强绑定的吗?会不会被某个模型「绑架」?


李文轩:完全不会。我们现在跟特定模型耦合的程度非常低,在生成层面也没有一直用 SOTA 模型。我们综合考量了成本、速度、毛利,是非常健康的,没有跟单个模型有任何绑定。


Founder Park:你们在产品里是不是有意隐藏了让用户选择模型的能力?


李文轩:没错,我们完全没有把这个暴露给用户。这跟用户画像非常相关,我们的用户就是来解决问题的,他根本不在乎你用的是什么模型,只要能解决他的问题,他就愿意付钱。


Founder Park:现在很多 AI 产品会有意无意地蹭旗舰模型或网红模型的流量,比如 Nano Banana 出来后,很多产品借此涨了一波量。你们没办法打这样的热点,会觉得遗憾吗?


李文轩:这件事也没有绝对的好与坏,把 token 的钱作为营销预算,这当然是一种方法。但我们的理念是,用户第一次接触一个产品时,大概率就已经建立了对它的心智。如果用户对我们的心智是「免费的 Nano Banana Pro」,那他来了大概率也不会成为长期留存或付费的用户。


对于我们这种想解决垂类问题的产品来讲,如果「免费用某个模型」这件事带不来我们想要的心智,我们就不会去做这种营销。当然,如果长期有这样的机会我们也会去抓,前提是不违背我们的用户心智。


比如像 Lovart 的心智就是一个视觉设计产品,用户就是想生成图片,Lovart  有一堆好用的工具能帮他把图变得更好,这就很合理。但对我们这种产品就不合理,我们是帮用户学习的,用户如果为了生图来到这个产品就很莫名其妙了。


06 

所有跑出来的产品,

都能用 10 个字让用户理解它的价值 


Founder Park:之前听说你们之后可能会推出其他类型的产品,比如硬件或者面向更大众人群的产品,做这些新产品的核心思考或者第一性原理是什么?


李文轩:最本质的逻辑,AI 有一个核心价值是无限的个性化内容供给,可以分为两类:泛娱乐内容和非娱乐的专业内容。我们坚定地在做后者,这也是我更感兴趣且个人认为机会更大的一个方向。


娱乐方面,你要跟字节去卷,字节现在做到 90 分,那我要做到 99 分才能卷过它,但我现在做的事,大家的体验是 -100 分,我把它拉到 -30 分,很多人的体验就会好很多。


不管是软件还是硬件产品,内容形态在变,它的载体、创作者怎么创作、消费者怎么消费,以及交互方式都会变。我们其实是在定义一种类似「动态知识」的形态,基于这个形态可能会出现新的软件,也可能会出现新的硬件,取决于最终用户需要什么样的载体。


我们做这件事的本源逻辑是:哪里的内容需要更多的供给、更多的个性化交互、需要 AI 的参与,才能让供给远远大于需求?


Founder Park:如果做硬件,它是入口、是复习设备,还是获客渠道?


李文轩:在硬件上,我们也在思考,暂时无法透露特别多。但我交流了大量的硬件和软件创始人,我觉得最本质的问题一直不在于硬件怎么做,不在于供应链搞不定,最终还是产品定义有没有打中用户的真实需求。


永远都在回答一个问题:用户为什么要用你不用他?我们做硬件一定不是为了做硬件而做硬件,肯定是因为我们想解决「知识不够适应人」这个问题。如果这个过程必须要新的硬件才能实现,我们就会去做;如果不需要,我们就不做。


我知道像 Rabbit 这种公司在硬件上栽了大跟头,我觉得他们本质的问题还是出在了产品定义上,不是硬件层面做出来的效果不好或者是在供应链上踩了太多的坑,还是因为产品定义出了问题导致了后续的问题。


创业到现在,最大的感悟是,很多时候你不知道怎么做或者做出来效果不好,还是因为你早期对这件事的本质想得不够清楚。


Founder Park:怎么看待 Plaud 这样的产品?


李文轩:Plaud 是一个很典型的正面例子。虽然不知道它未来能不能做成一家大企业,但起码从目前的现金流角度来讲,它可能是最成功的 AI 公司之一了。


它的产品定义就是抓到了一个过去没人发现、但用户又有真实需求的巧妙地方。很轻松地回答了「我为什么要用它」的问题,而且它围绕这个发现把一切要素都构建得很好,比如它找到了好的工业设计、制造商、营销团队,快速规模化,关键是他早期就想得特别清楚,Plaud 才能做出来。


Plaud 的模式后续肯定会被很多人借鉴,因为这相当于在硬件层面为用户多提供了一个新入口,如果它长期具备推送价值,有点儿像在用户家中放置了一块广告牌,带来的复利价值非常强。


Founder Park:除了 Plaud,这两年你还看到哪些在「解决用户什么问题」这个点上想得比较清楚的产品?


李文轩:Coding 类的产品肯定想得比较清楚,它们就是在朝着替代程序员的路上逐渐演进。


硬件有很多想得比较清楚的产品,我前段时间在深圳看到了一个用 AI 降噪的制冰机,这个需求乍一听感觉很 low,但其实,大多西方人都要喝冰水,传统制冰机在办公室里很吵,用 AI 去降噪就很合理。


还有像外骨骼,每个人可能都不想走路,特别是行动不便的老年人。这些产品都能很清楚地说明白「我为什么要买这个东西」。


虽然现在很多 AI 应用公司都喜欢讲大故事,但过去所有跑出来的产品,都是在 10 个字以内能让用户听懂它有什么价值,至少是在 C 端产品上是这样。


Founder Park:那用 10 个字,你会怎么介绍你们的产品?


李文轩:我们都不用 10 个字,就五个字:「考前急救包」,这就是从用户嘴里说出来的,这就是心智。


07

创业要坚持「反人类的理性」


Founder Park:团队现在大概多少人?结构是什么样的?


李文轩:现在团队不到十个人,基本都是在各个领域做出过一些结果的 00 后。组织层面,我们在探索 AI 时代下的新形态,不按照传统的软件公司去设置岗位和组织,遵循「AI First」,先思考这个岗位或职能,哪些是 AI 能做的?AI 能做到什么程度?AI 做不了的,我们再让人去做补充。我们的组织会更接近于「为结果负责」,不是「为职能负责」,比如团队有 10 个人,就意味着要负责 10 个结果,市场的视频曝光数、转化数、产品流程的留存数、付费数等。每个人都会通过 AI 实现 80-90% 的工作,比如营销人员发现主页转化率有所下降,他就可以通过 AI 的方式先有一个初步的修改方案以供查看。当然,最终的工程化还是需要专业的人去做,目前暂时还无法完全通过 AI 实现,所以我们还是有一定的分工。


我们在筛选团队成员时,第一,看重的是他必须真的相信 AGI 时代的到来,如果他不相信这件事会到来,那我们所做的这一切以及这家公司最初的出发点就不可能成真,这种事信则有;第二,我们希望招的人都能够从第一性原理出发去想问题。AI 时代更像互联网的最早期,没有过去的产品形态、组织形态、商业模式可以借鉴,需要回归最本质的问题,逐一解决。


Founder Park:为结果负责,不是为职能负责,是不是意味着你们在招聘时更加喜欢通才能力比专才能力强的人?


李文轩:首先,他一定要精通各种 AI 工具,用模型的能力足够强,清晰地知道 AI 的边界在哪里。


其次,他可能还是有一技之长的,比如他是个程序员,技术能力就是比别人强,但他必须对别的领域具备基本的认知。你要当一个 leader 的话,肯定不能只会一个单点,要对整个宏观视角都有一个比较清晰的了解,所以我们会让所有人都参与到整个业务的全流程中,比如写代码的同学也需要去参加营销会议并给出反馈。


我们没有期待着他进来之后再去改变他,在招聘的时候就会去筛选他是不是一个通才,或者他认不认同我的这套理念,我招聘的人还是更相信未来是一个「十人独角兽」甚至「一人独角兽」的时代。


Founder Park:从一个创始人的角度来看,你觉得自己的短板和长板分别在哪?


李文轩:我的短板在于:我的 MBTI 是 INTP,思考会非常多,但比较抽象,具象化起来会有难度。这一点合伙人 Elena 对我有一个特别好的补充,她恰巧是个 ENTJ,最擅长把一个很抽象的东西落地成大家可以干的事情。


长板方面,我觉得自己是一个非常理性的人。商业最终是一个很理性的行为,谁能够做到反人性一样的理性,谁就能在商业市场上获得一定的成功。不过这不绝对,这个世界上也有很感性的成功者。


Founder Park:怎么理解「反人性的理性」?


李文轩:一件事在理性上思考是这样的,但在感性上可能会受到很多影响,让你去质疑它理性上的正确性。比如,你从理性上推断一个逻辑是对的,但全世界都跟你说它是错的,这个错的结论可能是来源于一些感性的信息,人会受感性信息影响。坚持基于理性推论的结果去做事,很关键。


在创业过程中很常见,长期正确的事短期看上去往往是错误的,或者绝大部分人觉得它是错的。


我在创业过程就有很多人觉得「学习是反人性」「教育类的做不大」,或许从他们的感性理解层面是对的,但我从理性上推理,AI 带来的个性化内容机会,一定能在这个领域诞生很大的机会,我从理性上一直没有质疑过这一点。


08

想成为第一个定义新一代内容平台的公司


Founder Park:现在的 ARR 是 100 万美元,如果想在 2026 年或 2027 年把它变成 1000 万美元,核心难点在哪里?


李文轩:1000 万美元是一个大概率能达到的目标,这也是我们 2026 年内的目标,因为现在的商业模式、增长路径和本地化流程都已经跑得比较通了,做到 1000 万美元,只是把更多市场打透、把本地化做得更好,这只是一个时间问题。


但如果说做到 1 亿美元的 ARR,就需要去完成整个内容体系的搭建。如果仍然停留在一个效率工具的层面,一定有清晰的天花板或者较大的竞争问题。但如果是既提供个性化的交互工具,又提供个性化的内容,是能做到上亿美元的体量的。


Founder Park:所以突破天花板的关键,就是它最终不能只是一个工具产品的属性?


李文轩:对。过去所有跑出来的成功产品,没有一个是纯效率价值的产品。


比如苹果,它不但是一个流畅的手机,还提供了炫耀价值、艺术价值,它不光是一个纯效率的事,它还是个生态,绑定性很好。我不能一直只造一辆更快的车,还要让这个车有品牌调性,有除了速度以外的、服务不同用户需求的其他卖点。


Founder Park:你们的长期愿景是什么?


李文轩:我们最希望的是,未来每个人都能在这里找到最适合他的知识呈现方式,或者说,可以成为每个人默认的获取知识的入口。因为他在这里获取知识是最简单、最适合他、最爽且最能服务于他当下需求的。


最终形态的话,我从产品层面的定义是,要让最优质的知识和每个人最个性化的 context 在同一个平台被聚合,然后这些最优质的知识被拆散、重组,适配给每个人,是我们对新一代内容平台的定义。它可能会更像一个类似视频的、新的内容模态。


Founder Park:在 1-2 年的时间内,你们团队最想达成的关键节点是什么?


李文轩:一是,我希望我们能把「下一代年轻人知识获取的默认入口」这个品牌心智,占到市场头部位置。只要他要摄取知识,就能想到我们,在这里他能获取最适合他的知识、最好的交互方法、最短的学习路径。


二是,我希望能定义清楚新一代的内容平台到底是什么样的,它的创作者和消费者生态是怎么构建?内容的供给和消费是怎么因为 AI 而改变的?这件事现在没有人定义得很好,特别是在非娱乐领域。我们想成为第一个能够定义好新一代内容平台的生产和消费方式的公司。


最终,有没有可能出现新的物理载体?就像数字音乐出现时,出现了 iPod,没有数字音乐时是没有 iPod 的。我们其实是在定义一种类似「动态知识」的形态,基于这个形态可能会出现新的软件,也可能会出现新的硬件,这取决于最终用户需要什么样的载体。


Founder Park:后者听起来更大,可能这两年内只能看见一个雏形。


李文轩:对,它有点像 Adobe 定义了 PDF 一样。


Founder Park:你们选择了知识这个赛道,切的是广义上的「学习」场景。往远了看,人类的学习行为会被 AI 改造成什么样?


李文轩:第一,就算未来 AI 发展成了 AGI,获取知识这个行为仍然是人类必然存在的需求。只要你还有目标,那就一定要获取与这个目标相关的信息。


学习或者知识获取仍然有两个最大的价值。


未来有一种判断是,独立个体时代,所有人都是老板、AI 的指挥者,反而要求每个人理解、掌握更多信息,才能做出更宏观判断。如果你自己对某个领域完全不了解,是无法用好这个领域的人的,同理,你也用不好这个领域的 AI。


另一个是,知识获取是人类寻找意义感的一种途径。在相对衣食无忧的情况下,很多人并不想每天沉沦在多巴胺的刺激里,更想通过阅读和学习去感受和理解世界,这是马斯洛需求层次理论中的高维需求。未来 AI 把底层需求满足得越来越好之后,上层的需求会更有价值,覆盖面也会更广。


虽然当下通过学习寻找意义感的人在社会中相对较少,但我认为未来这一群体会日益壮大。一个很好的例子就是多邻国,它赋予了用户花的时间一种意义感,同样今晚有两个小时,是刷两个小时的多邻国还是刷两个小时的短视频?刷多邻国至少让我感觉自己还在进步。


我们在做的事情本质上是把最好的知识拆解、重组,然后适配给每个最个性化的人。我们现在的位置,第一步就是覆盖下一代年轻人,在他们进入职场前,把他们的个性化 context 和品牌心智先积累起来。有了这一步,未来不管是添加更多的优质内容,还是拿到他们更多的 context,都是实现长期愿景最好的第一步。


Founder Park:你会担心如果 AGI 来了,人类「理解知识」这个过程也会被取代吗?


李文轩:这个可能跟 AI 关系不大,跟脑机接口关系更大。如果真的有脑机接口的可能性或者达到一个商业化的可行区间,我们公司有可能会去做,这符合我们的愿景。


就算有脑机接口,它可能会变成一个基建,在这个基建上仍然能做应用。如果未来所有人都有脑机接口的话,为脑机接口搭建一套内容平台和交互方式,我们也会去做。目前来看可能还比较远。


文章来自于“Founder Park”,作者 “Founder Park”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0