全网都在扒的小米MiMo团队,几乎被“北大学子”承包了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
全网都在扒的小米MiMo团队,几乎被“北大学子”承包了
8691点击    2026-03-20 11:28

小米MiMo团队中,每天Agent对话次数少于100次的,就离职吧。


前脚,小米MiMo-V2-Pro模型刚登上OpenRouter调用量榜单第一。


后脚,罗福莉就发文分享了自己对于团队管理的思考。


热度几乎无缝衔接,网友们的目光也纷纷从模型本身转到小米MiMo团队身上。


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了


满打满算,从发布首个推理大模型MiMo-7B到现在不到的一年时间,MiMo的能力曲线却呈现出明显陡升——


短短时间内已冲到全球一线梯队


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了


相比之下,同样花重金组建的Meta超级智能实验室,近期却频频跳票,被爆模型性能远不如早前发布的前沿模型。


于是,不少人开始好奇:


小米MiMo,究竟是一支怎样的团队,竟能在几个月时间打造出让全球关注的模型?


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了


众所周知,大模型开发向来是集团军作战,model card的背后往往是多位作者的集体智慧。


而且据内部消息透露,小米的LLM团队在内部也相当神秘,但通过整理近半年的模型发布记录和论文,仍能捕捉到一些蛛丝马迹——


核心作者大多来自北京大学,其中甚至还有罗福莉本人的师弟。


更值得注意的是,北京大学也是罗福莉的老东家DeepSeek的策源地。


关于小米MiMo团队


小米MiMo团队近期的动作引发了外界广泛好奇,而这种关注与团队在产品侧和论文发表的「高节奏推进」密不可分。


随着多篇研究成果陆续曝光,小米MiMo团队核心成员浮出水面。


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了

△MiMo-7B技术报告核心贡献者


肖邦骏(Bangjun Xiao),MiMo-V2-Flash 的首作,本科及博士均就读于北京大学。


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了


博士生导师为北京大学人工智能研究院副院长黄罡教授。


他的研究方向聚焦于边缘计算和联邦学习,之前也短暂涉猎过计算机视觉和扩散模型。


Bingquan Xia,MiMo-V2-Flash 核心作者之一,中科院计算技术研究所2021届研究生。


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了


马文晗(Wenhan Ma),自2025年9月起在北京大学计算机科学学院攻读博士,由穗志方教授指导。


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了

△公众号:大信科


他的研究方向为大语言模型,近期主要关注提升大语言模型的推理能力。


本科毕业于北京大学电子工程与计算机科学学院,专业为计算机科学与技术。


值得一提的是,穗志方教授正是罗福莉在北大的导师,而马文晗则是罗的同门师弟


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了

△公众号「北京大学」罗福莉(后排左二)与导师穗志方教授(前排右二)合影


朱大为(Dawei Zhu),北京大学三年级博士生,导师为李素建教授,本科毕业于北京大学电子工程与计算机科学学院。


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了


研究方向为长上下文建模,他认为高效处理超长上下文是未来语言模型和多模态模型的关键能力,也对智能体(Agent)、对齐(Alignment)以及多模态模型的进展感兴趣。


此前,他参与的《paperbanana》项目曾引起较大关注,并被量子位关注。


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了


董谨豪,中国人民大学信息学院/数据工程与知识工程教育部重点实验室讲师,同时也是小米大语言模型(LLM)核心团队技术顾问,主要负责与代码相关的LLM开发,包括预训练、强化学习及智能体方向。


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了


他主导建立了人大发–小米基础大语言模型联合重点实验室,并担任技术委员会成员。


他博士毕业于北京大学计算机科学学院,本科毕业于西安电子科技大学计算机科学与技术专业。


张海林,小米MiMo团队成员,专注于AI基础设施建设,为MiMo系列模型打造高效、可扩展且稳定的强化学习(RL)基础设施。


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了


他2025年获得北京大学计算机科学博士学位,导师为崔斌教授,并曾获北京大学优秀博士论文奖。


研究重点包括大规模大语言模型(LLMs)、深度学习推荐模型(DLRMs)、信息检索(IR)及通用分布式计算。


此外,还有诸多核心作者,但公开信息较少,部分谷歌主页如下:


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了


小米MiMo是一支怎样的团队


一支成立才一两年的团队,能一路冲到顶尖模型研发的前列,靠的绝不只是产品节奏和核心成员这么简单。


仔细梳理团队的背景,我们也会发现一个明显的共性——北大背景浓厚


从核心成员到技术骨干,很多团队成员本科或博士均来自北京大学计算机学院。


一方面,北大的同门关系、导师体系和院系传承,使得小米在大模型工业界作为后起之秀,能够源源不断地吸纳新鲜血液;


另一方面,学生们也能迅速接触工业界,借助丰富的算力和资源,将科研想法高效落地与迭代。


而在这个过程中,罗福莉则成为团队与北大学术背景之间的重要桥梁。


全网都在扒的小米MiMo团队,几乎被“北大学子”承包了

△图源:北京大学公众号


除了院校对于成员产品理念的影响外,小米MiMo团队的技术理念也深受小米企业产品基因的驱动——


核心就是产品层面的「性价比」和公司一贯的「互联网生态」思维。


放到MiMo模型上,最直观的体现就是7B参数规模、开源策略以及端侧部署方向,也算是清楚地展现了小米的战略布局和生态思路。


所以回过头看,MiMo的成功并非偶然,而是多重因素叠加的结果:


北大科研背景的厚度、核心成员的技术经验,以及小米产品与工程的基因驱动,共同铸就了这支年轻团队的迅速崛起。


对了,还有一个颇有缘分的小细节值得一提——


不久前从阿里离职的通义实验室Qwen大模型负责人林俊旸,正是罗福莉的师兄。


两人硕士阶段均在北京大学语从事自然语言处理相关学习研究,学术路径高度同源。


毕业后又先后加入阿里达摩院,在大模型研发上有着相近的技术底色与行业视野。


一个曾做Qwen,一个带MiMo。


两条国内头部模型线的关键人物,曾经在同一套学术和产业体系中成长出来,这层关系本身也让不少业内人多看了一眼。


参考链接:

[1]https://arxiv.org/pdf/2505.07608

[2]https://github.com/CuteNPC


文章来自于“量子位”,作者 “henry 梦瑶”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI