Z Potentials|李岩,前快手多模态技术负责人创立元石科技,“问小白”重塑信息交互入口,上线四个月DAU突破百万

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Z Potentials|李岩,前快手多模态技术负责人创立元石科技,“问小白”重塑信息交互入口,上线四个月DAU突破百万
5980点击    2025-07-08 11:35

Z Potentials|李岩,前快手多模态技术负责人创立元石科技,“问小白”重塑信息交互入口,上线四个月DAU突破百万


“上线 4 个月,DAU 破百万,累计用户破千万,用户日均对话次数超 9 次,跻身国内同类产品第一梯队 ——元石科技的‘问小白’用生成式推荐重新定义AI时代的信息获取与消费。


作为中国 AI 应用进阶之路的亲历者与推动者,李岩的职业履历堪称这个时代的技术发展缩影。从早期深耕计算机视觉领域,到主导构建快手的 AI 核心能力,再到独立创业打造“问小白”,他始终站在 AI 应用落地的第一线,持续推动技术从实验室走向大众生活。


在大模型时代,李岩将下一阶段的目标锁定在“信息获取和内容消费”这一最具普适性的领域,重构信息供给结构,改变大众与AI内容的交互方式,降低大众获取高质量信息的门槛,立志用 AI 真正撕碎信息差的高墙,纾解“信息过载时代焦虑”。


在这次访谈中,李岩将系统讲述他对信息产品演变路径的理解,“问小白”在数据与技术层面的突破,以及元石科技如何通过技术创新,推动AI真正服务大众,缩小信息不平等,助力普通人拓展认知边界。星涵资本担任元石科技的独家顾问。


Z Potentials|李岩,前快手多模态技术负责人创立元石科技,“问小白”重塑信息交互入口,上线四个月DAU突破百万


  • 我在职业选择上始终遵循内心对技术发展的判断.......相比其他类型的移动互联网产品,快手的业务场景对于我所擅长的AI技术有更强的实际需求,同时也能带来清晰的技术正反馈。


  • 当年,短视频、直播作为典型的“容器型产品”,经历了从满足边缘群体需求到服务主流大众用户的完整过程,这让我深刻理解了容器类产品与传统工具类产品的本质区别——容器类产品具备极强的用户共建能力,产品边界随着用户需求不断扩展,呈现出动态演化的特点......AI不仅仅是冷冰冰的技术工具,更是一个可以承载用户需求、表达、互动与共创的平台......Gen AI不仅是技术本身的升级,更是信息承载与传递方式的一次重构,具备成为“新型信息容器”的属性


  • 我们选择从信息获取和消费场景切入:一方面,大模型在信息理解和内容整合上的优势,与这一需求天然匹配;另一方面,这是连接普通人日常生活与技术进步的高频场景,具有较强的普适性和扩展空间。


  • 元石科技聚焦在一个相对明确却价值深远的方向——提升普通人信息获取的效率与质量这看似是一个基础问题,但实际上信息差决定了人与人之间的思考深度、认知边界,甚至影响了社会资源的流动与分配。


01 从技术好奇到产业变革:十五年AI路上的关键转折点


ZP:您是什么契机下踏入AI领域的?


李岩:我是在2009年开始接触计算机视觉领域的,当时有幸参与了CNN(卷积神经网络)相关的研究,算是国内较早一批在这个方向上深耕的人。那时,人工智能还远没有如今这样火热,真正的应用场景也非常稀缺。


但我始终对AI充满好奇。对我来说,它不仅是一项前沿技术,更像是人类智能的延伸,是计算机“理解世界”的起点。我曾为自己设定了三年时间,哪怕在短期内它看起来并不“实用”,也愿意全身心投入,去探索AI背后的原理与可能性。


后来我加入了腾讯,恰逢QQ空间和朋友圈高速增长的阶段,每天有超过10亿张用户图片上传。传统的人工审核方式早已无法应对如此庞大的内容量。CNN的技术,第一次真正地在大规模UGC图片的合规审核、标签生成、广告投放等环节找到了用武之地。那一刻,我也第一次感受到,之前那些看似“高冷”的技术,终于接上了地气,开始改变现实世界的运行方式。


ZP:您在快手主要负责了哪些工作?这段经历对您的AI技术认知有什么影响?


李岩:在快手期间,我主要经历了两项重要工作。第一,我从零搭建了快手第一个深度学习团队,团队规模在我负责期间扩展到一百多人,涵盖计算机视觉、语音识别与合成、自然语言处理、音乐理解与生成、多模态算法以及相关的工程架构建设。第二,我主导搭建了搜索业务部门,覆盖快手搜索的技术、产品、运营和商业化体系。


回顾这段经历,技术层面的认知也发生了实质性转变。业界有一篇广为认可的文章《苦涩的教训》(即强化学习之父Richard S. Sutton所著《The Bitter Lesson》)中提到,AI 历史反复证明,真正带来突破的,始终是可随算力、数据扩展的通用方法。早期AI应用大多依赖于人工标注的数据,这类数据获取成本高且规模有限。而搜索技术的特点在于,数以亿计的互联网用户每天都会自然产生海量数据,这为模型参数和数据规模的持续扩展提供了条件;搜索引擎本质上是一套大型动态的实时在线机器学习系统。我们团队也因此切实感受到了Scaling Law带来的算法效果提升


Z Potentials|李岩,前快手多模态技术负责人创立元石科技,“问小白”重塑信息交互入口,上线四个月DAU突破百万


同时,互联网行业中,搜索、推荐、广告领域的从业者通常与视觉、语音等方向的团队相对独立,而我恰好有机会在两个方向上都深度参与,具备了跨领域的系统性理解。


后续我的职业路径也从单纯负责后台算法,逐步扩展到中台、前台业务的建设与管理。从最初搭建纯技术导向的算法团队,到后期承担产品、运营职责,我越来越清晰地意识到,真正的技术落地和产品价值,需要走出技术本位,亲自参与业务场景,深入理解用户需求。勇于进入一线、直面实际问题,是推动技术进步与个人成长不可或缺的过程。


02 直面大模型落地新挑战,创办元石科技推动信息获取效率变革


ZP:是什么契机促使您创立元石科技,并决定从内容赛道切入?


李岩:“问小白”从公司创立之初就有非常明确的方向——我们希望构建一套基于大模型的生成式推荐系统,打通内容的生成、分发和消费的全链路,为用户带来AI时代全新的内容交互体验。


具体来讲,创办元石科技的直接动因是大模型,尤其是ChatGPT的出现。在此之前,AI系统大多是高度依赖场景的“专用型”系统,基于特定领域数据训练的模型,虽然在对应场景内可以工作,但一旦超出这个范围,系统的智能性就会大打折扣,甚至变得不可用。而大模型则代表了一次产业级的技术变革。技术上限被极大提升,产品格局也将被彻底重构。


从产品落地的角度分析,不同赛道中,内容领域无疑是对大模型依赖程度最高、技术价值最容易转化的方向。推荐和搜索等大型机器学习系统,也正在被LLM重塑。大模型拥有更加长尾的世界知识、更强的逻辑推理能力、以及真正个性化的记忆与交互,因此必然会极大地提升内容生产和分发的效率,带来全新的内容消费范式。


03 打造面向大众的AI产品,“问小白”重塑AI内容交互体验


ZP:“问小白”有什么不同之处?


李岩:我们希望打造一款面向大众的生成式内容产品,围绕“信息获取与消费”这一普遍刚需,借助生成式AI技术,提升信息获取效率与质量,创新人与AI内容的交互方式。“问小白”的产品设计,结合了“主动提问”和“Feed信息流”两种模式,通过“主动 + 被动”的交互方式,构建出一个完整的“生成 - 分发 - 消费”的 AI 内容闭环。内容因用户需求而生成、因理解用户而精准分发、因高质量体验而激发更多消费与分享,最终推动下一轮生成。


这一模式背后的核心变化,是AI内容范式正在从传统的“供给驱动”转向“需求驱动”。也就是说,不再是预先批量生产内容、等待用户上门消费,而是围绕用户的兴趣、行为和对话语境,实时生成个性化内容,满足更细分、多样化、长尾化的用户需求。当高质量内容触达用户后,就会触发 “优质内容驱动分享” 的飞轮。用户把 AI 互动生成的内容二次创作或直接分享,既有娱乐性,也带社交属性。对普通人而言,这些内容 通用、易消费,又带情绪价值,所以更愿意转发、讨论。这一步把消费端的热度又反馈给生成端,形成持续迭代的闭环。


ZP:过去几个月,“问小白”的增长势头非常亮眼,能否和我们分享一些关键的数据和趋势?


李岩:我们是在今年二月份正式对外发布了全新版本的“问小白”产品。从上线至今,不到四个月时间,整体数据表现出较为明显的增长趋势。截至目前,日活跃用户(DAU)已突破百万,整体月活跃用户(MAU)规模较年初增长了40倍以上。这一增速,放在整个行业背景下,相较于同类AI产品,尤其是在国内信息类产品中,用户增长和活跃度具备一定的结构性突破。根据第三方榜单数据,“问小白”在今年第一季度保持高速增长,2月全球增速排名第2,3月位列第9,跻身全球AI产品增速前列。


Z Potentials|李岩,前快手多模态技术负责人创立元石科技,“问小白”重塑信息交互入口,上线四个月DAU突破百万


我们始终强调,“问小白”不仅是一个信息工具,更是信息分发模式的一次重构。具体来看,用户与产品的交互深度,是衡量这一变化的直接指标,其中对话Session数量和用户被动浏览信息的时长是两个最具代表性的维度。


过去,用户可能一天只会在“问小白”提出一两个问题,更多处于尝试或工具性使用阶段。随着产品体验和内容能力的提升,越来越多用户每天会提出十个甚至更多问题。这种频次的变化,实质上意味着“问小白”正在成为用户获取信息、辅助决策的常规渠道,从信息分发的入口逐步向高粘度AI产品迁移。我们也观察到一部分用户开始在“问小白”中进行更专业的内容创作尝试,虽然占比仍处于相对早期阶段,但增长趋势清晰,反映了AI内容生成能力向更高复杂度场景的自然渗透。数据也印证了这一趋势:过去几个月,“问小白”用户日均对话次数保持在行业TOP2-3水平。


Z Potentials|李岩,前快手多模态技术负责人创立元石科技,“问小白”重塑信息交互入口,上线四个月DAU突破百万


另一方面,用户在平台上被动浏览信息的时长,也呈现出稳步提升。相比传统信息流,基于大模型的个性化信息整理与推送不仅帮助用户降低了信息筛选成本,提升了获取效率,也让信息消费更加系统化、结构化。这种体验上的变化,背后对应的正是信息分发逻辑从“人找信息”向“信息找人”的转变,并且是‘高度个性化生成的信息’。


ZP:作为一款面向大众用户的AI产品,“问小白”在技术架构和模型能力上做了哪些关键突破,支撑其体验优势?


李岩:“问小白”作为面向大众的AI产品,从第一天起我们就在技术架构层面做了系统性思考。2023年,公司写下的第一行LLM代码,就是基于MoE(Mixture of Experts,混合专家模型)的架构。我们非常清楚,做ToC产品,尤其是在信息获取和内容消费类场景下,高并发是必然挑战,而要在推理效率和响应速度上具备竞争力,必须从底层设计上确保技术优势。相比传统单一模型结构,MoE架构在推理效率上的表现具备数量级的优化空间,这也是我们从一开始就选择这一路径的原因。


过去一年里,我们自主训练了多个MoE架构的大模型,并在训练策略上也进行了技术创新,采用了基于网络自生长的训练方法,在数据合成算法、资源调度效率上都做了针对性优化。这些方法不仅在成本控制上起到效果,也使模型在实际效果上取得突破。我们开源了7B参数规模模型,在编码能力和数学推理能力上,已达到并超越了Claude 3.5同等级别模型的水平,这在当前国内外开源社区中也具备一定代表性。


此外,我们自主研发了对标OpenAI-o3技术路线的元石自反思推理模型(Reflective Generative Reasoning Model )。即将开源的MetaStone-S1系列模型,在STEM类型的复杂任务(全美数学竞赛AIME24、25,代码LiveCodeBench)、中文通用知识C-eval上,取得了和OpenAI-o3可比的性能。具体来说,MetaStone-S1-low全面领先于OpenAI-o3-mini-low,MetaStone-S1-medium和OpenAI-o3-mini-medium打平。


Z Potentials|李岩,前快手多模态技术负责人创立元石科技,“问小白”重塑信息交互入口,上线四个月DAU突破百万


在Agent技术方面,我们近期上线了“小白研报”功能,定位对标OpenAI的Deep Research。用户可以基于几百个网页内容,快速生成几万字甚至十几万字的完整PDF报告,配合结构化的信息梳理和可视化网页输出,降低了普通用户获取系统性信息的门槛。并且我们将DeepResearch 20分钟的处理时间降低到了2分钟以内,能够满足用户更加广泛的任务需求。


ZP:在AI产品百花齐放的当下,您如何判断哪些方向值得长期投入?我们又是如何走出一条与众不同的路径的?


李岩:我们始终相信,AI不仅是技术本身的升级,更是信息承载与传递方式的一次重构。很多行业都在探索AI对于特定垂直场景的应用,比如代码生成、设计辅助、销售支持等,这些领域的确存在技术替代或效率优化的机会。但如果回到商业本质,垂直场景的市场规模、用户基数和商业空间,往往相对有限。而我们始终选择”对普通人影响最大“的方向,普通老百姓未来会比程序员、设计师、技术工作者更需要AI。


信息获取和内容消费始终是更具普适性、需求更基础、覆盖用户更广泛的领域。我们判断,只有在这些高频、刚需、面向大众的场景中,AI创造出的价值才能被快速感知,进而反哺技术本身,推动资源、资本、研发持续投入,形成正循环。


ZP:我们的长期愿景和定位是什么?


李岩:元石科技聚焦在一个相对明确却价值深远的方向——提升普通人信息获取的效率与质量这看似是一个基础问题,但实际上信息差决定了人与人之间的思考深度、认知边界,甚至影响了社会资源的流动与分配。


人区别于动物的根本是使用工具的能力,而人群之间的区别,更多来源于信息获取的效率和质量。从这个视角出发,信息获取不应只服务于少数专业群体,更应该是技术普惠的重点,尤其是在AI技术演进的背景下,信息不平等带来的结构性问题值得被重新审视和解决。


ZP:能否介绍一下你们的团队?在选人用人方面有什么标准?团队的文化是怎样的?


李岩:我们的团队结构相对平衡,核心成员主要来自两类背景。一部分是经历过大规模业务验证、在行业中有实战经验的成员,另一部分是具有成长潜力的优秀应届生,两者比例大致各占一半。年轻成员中,也包括具备突出潜质的同学,比如华为“天才少年”计划中选拔出的优秀人才。


我们的团队文化是包容的,包容每一种才能,不轻易下判断或否定,我们既要看到经验的价值,同时要相信新鲜血液的力量。这个过程中往往需要团队的磨合,我们需要沟通和交流,不止是语言上的交流,也有在项目进程中的互相观察。我认为,最理想的团队状态,不是简单的组织结构组合,而是每个成员都能从身边的队友身上感受到力量、获得新的认知,最终实现个人能力与团队整体的共同进步。


ZP:最近有哪些您感兴趣的创新产品或公司?和您最近在看的书?


李岩:我一直关注信息获取相关的产品,尤其是如何通过结构化手段提升信息质量和效率。比如在AI新闻领域,Particle.news是一个我最近比较关注的产品。他们尝试用更结构化的方式整理新闻内容,针对同一事件提供正反两方信息,主要面向经济、时政等领域的专业人群。这种信息整理思路本身很有启发性,但我更关心的是,如何把类似理念真正带入大众信息获取场景,降低普通用户理解复杂信息的门槛。


最近在读的书是《Discovered, Not Designed》。作者提出,推动世界进步的路径正在发生变化,过去依赖定理、定律式的系统设计思维,越来越难以适应当下的复杂环境。相反,更重要的是发现与引导系统内涌现出的新能力。这一点与AI的发展趋势很接近,也是我个人在思考产品和技术路径选择时的参考逻辑。


请注意,此次访谈内容已经过精心编辑,并得到了李岩的认可。欲了解更多关于元石科技的信息,敬请访问其官方网站 https://www.wenxiaobai.com/。我们也欢迎读者通过留言互动,分享您对本访谈的看法。


Z Potentials 将继续提供更多关于人工智能、全球化市场、机器人技术等领域的创业者访谈。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。


文章来自于微信公众号“Z Potentials”。


关键词: AI , 问小白 , 元石科技 , 李岩
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales