2024年底,一则《雷军千万年薪挖角95后AI天才少女》的热搜引爆全网,让“罗福莉”这个名字再度成为热门话题。事实上,早在2019年,“八篇ACL论文”的佳绩就让她在硕士期间成为知乎上的风云人物。直通阿里星项目进入达摩院、开源大模型DeepSeek-V2的核心开发者、“天才AI美少女萝莉”……这些闪亮的头衔让人不禁好奇,这位95后女孩究竟有何特别之处?
然而,鲜有人知道,这个被誉为天才的少女,曾经也是一个连Python都不熟练、为学术压力焦头烂额的普通学生。是什么样的努力与机遇,让罗福莉一路“开挂”,最终被雷军青睐?接下来本文将带你走近这位“天才AI少女”,了解她如何从普通走向非凡,用行动书写属于自己的“花路”。
图片来源:新浪微博
1995年,罗福莉出生在四川宜宾的一个普通家庭。父亲是一名电工,家庭并不富裕。回顾求学之路,罗福莉曾经戏称自己是“误打误撞”进入了北京师范大学计算机系。但其实,“稳扎稳打,绝地反击”可能用来形容她更合适。
从小,罗福莉就喜欢把任务拆分成一个一个阶段性目标。在父亲的引导下,小学期间,罗福莉缓慢爬坡终于来到班级前两名;随后的求学时光中,罗福莉虽然在新阶段开启的时候有所松懈,但总能抵住压力,成绩波浪前进,螺旋上升。正如罗福莉的班主任评价她:“当时在班上罗福莉成绩虽说不是最拔尖的,但也足够优秀,重要的是她非常刻苦。”
从四川省宜宾市第一中学“清北班”毕业后,罗福莉虽然如愿来到北师大,但专业却是被调剂到了电子专业。面对自己不喜欢的专业,罗福莉也曾坦言,自己有些迷失方向:“刚上大一的我,东一榔头西一棒槌,迷惘不知所向,期末排名也是靠后。” 值得庆幸的是,经过老师的点拨,罗福莉在大一下学期转入计算机专业,这才为日后的所有成就奠定了基础。
图片来源:百度百科
“计算机领域绝对的‘低起点’者”,这是罗福莉在微信公众号上对自己下的定义。或许很多人会觉得这不过是成功者的谦虚幽默,但要知道,计算机的学习对刚转专业的罗福莉来说,无疑是巨大的挑战。在四五十人的班级,她的成绩一度无法排进前三十,连中流砥柱都算不得。其他同学三分钟就能解出来的Coding题,她要花整整三个小时。罗福莉曾说,遇到不会的题,唯一的办法就是先去操场跑两圈,然后回来继续硬磕。
但就是靠着一股不服输的劲头,罗福莉花了不到一年的时间,竟然硬是将总成绩从屈居末流提到班级前五,顺利达到了保研的标准。大三期间,她积极寻找北京大学的导师和实验室,为未来的学术研究铺路。但新的挑战,也随之而来。就像罗福莉在社交媒体上写的那样,不断出现的打击和对自己学术能力的怀疑,让她一度想逃离学术,甚至转行做产品。
实验室里高手如云,十个同组同学,九个是北大男生,而自己连python都不会…罗福莉没有迷失方向,她清楚地知道,既然已无退路,那就绝地反击!罗福莉恶补欠缺知识,努力赶超论文进度,终于在大年十五那天提交了自己的第一篇自然语言处理领域的顶会论文。“我那一年大年二十九回到家,大年初五又回学校赶稿,赶到了正月十五,投出论文后回寝室听到外面放烟花(的声音),躺在寝室床上,眼泪哗哗往下流。”罗福莉在阿里达摩院的专访视频中这样回忆道。
图片来源:搜狐网
这段宝贵的求学经历,不仅让她再次意识到了自己的潜力,也逐渐厘清自己对自然语言处理领域的研究兴趣。读研来到北大后,罗福莉开启了开挂人生。与同龄人不太一样的是,从图书馆到宿舍,罗福莉在北大过上了二点一线的生活,将自己深深扎根在学术研究中。在鼓足勇气向各大计算机科学期刊投稿后,属于她的高光时刻悄然开启。研二这一年,她在人工智能领域顶级国际会议ACL上发表了8篇论文,其中2篇是第一作者。要知道,国际顶级会议ACL(Annual Meeting of the Association for Computational Linguistics) 是自然语言处理(NLP)和计算语言学领域的全球最高级别学术会议之一,水平极高,是学术界和工业界公认的顶尖会议。ACL会议的论文接收率通常为20%-25%,有时甚至更低。而罗福莉竟然一年连发8篇!至此,“天才AI少女”的桂冠正式落在她头上。
也许在大众的视野里,继续攻读博士学位对她而言本就是恰逢其时。但出乎大家意料,2019年,罗福莉选择离开象牙塔,加入阿里达摩院。其实成绩优异的她,也接到了腾讯技术大咖、百度AIDU计划等项目的橄榄枝。权衡再三之后,罗福莉选择了更偏向重要研究的阿里达摩院。据知情人士向有关媒体透露,罗福莉通过阿里星项目进入阿里达摩院。阿里星项目是阿里巴巴集团专门为招聘全球顶尖高校优秀毕业生而设计的高潜力人才计划,是校招的最高级别,类似于华为“天才少年”计划,“通过阿里星项目的校招生,都是百里挑一。”
在这里,罗福莉花了半年时间调整自我,努力适应工作节奏,并开始投入到人工智能研究中预训练语言模型相关的部分工作中。罗福莉负责阿里深度语言模型体系(AliceMind)的开源,并主导开发AI预训练模型VECO。
图片来源:bilibili
AliceMind 是阿里巴巴达摩院推出的一个自然语言处理(NLP)框架,主要致力于支持多语言、多任务的预训练模型研究和应用。据央视网消息,2022年11月25日,在中文语言理解领域权威榜单CLUE中,AliceMind 以86.685的总分成绩创造了新纪录,这是该榜单诞生近三年以来,AI首次超越人类成绩(86.678),意味着AI模型的中文语言理解水平达到了新的高度。
而VECO是 AliceMind 的核心成果之一,是一个多语言预训练模型,其名字来自 “Versatile Encoder for Cross-lingual Understanding and Generation” 的缩写。VECO广泛用于阿里巴巴的跨境电商业务,例如 AliExpress 的实时翻译和客户服务系统。有媒体报道称,AliceMind的核心在电商领域得到了充分应用。其翻译平台每日有上亿次调用,成功带来价值超过数亿美金。这样的AI神器,就是罗福莉主导开发的。
两年后,罗福莉调整事业规划,加入私募公司幻方量化,从事深度学习相关策略建模和算法研究。幻方量化是一家依靠数学与人工智能进行量化投资的公司,2015年成立,迅速成长为百亿规模的私募基金。此后,罗福莉转入幻方量化子公司“深度求索”(DeepSeek)。DeepSeek是一家专注于人工智能和大规模语言模型研发的科技公司,成立于2023年7月,由量化投资巨头幻方量化创立。
从此刻起,属于罗福莉的另一个高光时刻即将到来。她参与研发的重要项目DeepSeek-V2一经发布就引发了广泛关注。DeepSeek-V2是 DeepSeek 推出的第二代大规模语言模型,于2024年5月发布,以其高性价比和技术创新而闻名。该模型将推理成本降低至每百万tokens仅1元人民币,是GPT-4 Turbo的七十分之一,因此被誉为“AI界的拼多多”。DeepSeek在行业内上演鲶鱼效应,不仅打响了大模型市场的价格战,也让罗福莉的名气随之水涨船高。“单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队”,“外加1元/百万输入Tokens的价格,性价比之王。”罗福莉曾经在知乎上做出过这样的描述。
图片来源:百家号
仅仅半年之后,2024年12月,Deepseek宣布全新系列模型DeepSeek-V3首个版本上线并同步开源。官方称,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。相较GPT-4o等模型的训练成本约为1亿美元,V3模型的总训练成本为557.6万美元。
2025年1月20日,DeepSeek再次推出深度推理版本 DeepSeek-R1。新模型一经亮相,迅速引发行业关注。其在数学、代码和自然语言推理方面表现出色,与OpenAI o1旗鼓相当,并在多个基准测试中展现了卓越性能。
例如,DeepSeek-R1 在 AIME 2024 数学竞赛中取得了 79.8% 的成绩, OpenAI o1-1217以因0.6%的差距屈居第二;而在MATH-500测试中,DeepSeek-R1 更是以 97.3% 的高分表现,超 o1-1217 近1%,同时显著领先其他模型。
图片来源:雷锋网
随着R1的发布,DeepSeek已成功登上中国和美国苹果应用商店的免费应用榜单第一位。在美国市场,DeepSeek已超越ChatGPT,标志着中国AI产品在全球市场上实现了历史性突破。而在中国市场,DeepSeek也超越了豆包。
回顾DeepSeek推出的这一系列大模型,罗福莉的名字都出现在了论文的鸣谢人员名单。
图片来源:微信公众号 CEO来信
图片来源:DeepSeek-R1论文
而就在DeepSeek-V3发布的前几天,有媒体报道称,小米创始人雷军拿出千万年薪高价,招揽罗福莉领军小米AI大模型团队。消息一出瞬间在业内引起轰动,再次让罗福莉进入公众视野。据消息,罗福莉目前确已从DeepSeek离职,但是否加盟小米,还有待证实。
的确,小米在AI领域频频布局是有目共睹的。从2023年4月,小米正式组建了AI实验室大模型团队;去年11月成立AI平台部。据相关媒体报道,小米集团总裁卢伟冰曾表示,“预计2024年小米研发费用为240亿元,2025年将达到300亿元,5年(2022-2026)预计研发费用超1000亿元,而研发投入主要方向为AI、OS、芯片。”如果小米和罗福莉牵手成功,会碰撞出怎么的火花?业内无比期待。
“天才AI美少女萝莉”,面对这样的桂冠,罗福莉却十分低调。她曾经坦言,自己并不是所谓神人,也不希望自己被神化和娱乐化,她只是一个坚守梦想的普通人。还曾有人找到她,希望她出书,甚至经纪公司也想来签约…面对这样的风口,罗福莉却显得尤为克制。
就像面对曾经八篇论文的战果,罗福莉用“努力”和“运气”轻松总结自己的成功。她本人在知乎回应称:“这次投稿ACL是我近一年的产出,所以我认为自己是付出了足够的努力的,当然也可能也有运气成分加持。”
图片来源:知乎
没有自命不凡,而是脚踏实地。罗福莉经常在社交平台和粉丝交流互动,也会给有同样人生困惑的网友们答疑解惑。曾经有网友留言,觉得上级分配任务杂乱不堪,不知道如何抉择。罗福莉回复称:不要排斥做杂事儿,而且要做到“极致”。在这个过程中,有眼光的领导会为你分配更重要的事情;而如果领导没有发觉,自己主动请缨也未尝不可。这份对“极致”的初心,也让罗福莉能够在AI领域有所建树。
图片来源:罗福莉公众号
自带互联网光环、深耕AI领域前沿、为人低调谦逊,罗福莉,一个集过硬的技术和人格魅力于一体的“普通人”。在AI战场如火如荼的当下,罗福莉就像一阵清爽的风,刮过浮躁与喧嚣,带来专注与坚韧的力量。
参考资料 Reference
1. 罗福莉公众号
2. 雷军千万年薪挖的95后AI才女,曾是连python都不会的大学生
https://mp.weixin.qq.com/s?__biz=MzkwNjAyMzkxOQ==&mid=2248271746&idx=1&sn=47fa05aeae92c0fc694b8e1c32fce8fc
3. 雷军花千万挖人、头部量化私募创立、95后AI“天才少女”,这家AI公司刷屏https://baijiahao.baidu.com/s?id=1819837167153096274&wfr=spider&for=pc
4. 传闻中由雷军亲自出马、豪掷千万年薪挖角的员工,是什么样的?https://m.thepaper.cn/baijiahao_29835881
5. 如何看待北大硕士生在自然语言处理顶级会议 ACL 2019 上发表 8 篇论文?https://www.zhihu.com/question/325528604
6. 从不被看好到保送北大,小镇姑娘罗福莉的成长笔记!https://www.bilibili.com/video/BV1Ah4116772/
7. “95后”罗福莉:一直在成长
https://news.sciencenet.cn/sbhtmlnews/2025/1/382827.shtm
8. 千万年薪的AI天才少女:罗福莉成功之路的启示与启发
https://news.sohu.com/a/846113556_121924584
9. 今年的天才少女“有点多”
https://user.guancha.cn/main/content?id=1356945
10. DeepSeek创始人梁文锋,广东人,17岁考入浙大,30岁创办幻方,36岁管理千亿私募,仅靠百名中国程序员,已赶超OpenAI
https://mp.weixin.qq.com/s/hgfvLRJzaTaSUjX8IrPAPg
11. DeepSeek开源推理大模型R1:纯强化学习实现接近OpenAI o1水平,成本降至1/30
https://baijiahao.baidu.com/s?id=1821910075732851287&wfr=spider&for=pc
12. DeepSeek-R1 最新发布,剑指 OpenAI o1
https://baijiahao.baidu.com/s?id=1821916523161314424&wfr=spider&for=pc
文章来自微信公众号 “ Z Finance “,作者:Monte Yu