再一次,Meta「搜刮」了 OpenAI 的成员。The Information 发布了文章,谈到 Meta 再聘四名 OpenAI 研究人员。这离上一次 OpenAI 苏黎世办公室被 Meta 一锅端只隔了短短几天时间。
在 4 月发布 Llama 4 AI 模型后,Meta 启动了一波大规模招聘潮。据悉,Llama 4 的表现并未达到 CEO Mark Zuckerberg 的预期,而 Meta 也因其在热门基准测试中所使用的 Llama 版本而受到外界批评。
与此同时,Meta 与 OpenAI 之间也爆发了一轮口水战。OpenAI CEO Sam Altman 声称,Meta 正向人才开出「1 亿美元的签约奖金」,但他补充说,「到目前为止,我们最顶尖的人才」都未被挖走。
对此,Meta CTO Andrew Bosworth 则向员工表示,虽然部分高管确实收到了类似金额的报价,但实际的报价条款远比单纯的一次性签约奖金要复杂得多。换句话说,这不是一次性的即时现金。
上一次被挖走的三位小伙伴都参与了 ViT 等重要研究。这次被挖走的小伙伴也是参与了不少 OpenAI 的重要工作。
他们分别是:
这些研究员是 OpenAI 模型从 GPT-4 到 GPT-4o,以及轻量化模型(如 o1-mini、o3-mini)研发的中坚力量。暂不知这会不会造成 OpenAI 人才短期断档,对 GPT-5 的到来产生影响。吸收这些人员之后,Meta 在大模型技术栈中最弱的一环 —— 模型微调和多模态对齐 能得到质的飞跃吗?我们可以一起观察一下。
网友对 Llama 5 的有趣猜想
接下来,我们来简单了解下这几位研究者的履历:
Shengjia Zhao
根据领英简历,Shengjia Zhao 在 2022 年 6 月加入 OpenAI。
他本科毕业于清华大学,博士毕业于斯坦福大学(计算机科学),曾获得过 ICLR 2022 杰出论文奖。
加入 OpenAI 之后,Shengjia Zhao 参与了重要大模型的训练,包括 GPT-4、GPT-4o 和 o1。
Jiahui Yu(余家辉)
余家辉在 2023 年 10 月加入 OpenAI,现任 Perception team(感知团队)负责人。在此之前,他曾是谷歌 DeepMind Gemini 项目多模态的负责人。
他本科毕业于中国科学技术大学少年班计算机科学专业,并在伊利诺伊大学厄巴纳 - 香槟分校获得博士学位,师从 Thomas Huang 教授。他的研究领域包括深度学习和高性能计算。
从他的精选项目中,我们可以看到,他作为研究负责人、顾问先后参与了 OpenAI 的「Thinking with Images」、o3 和 o4-mini、GPT-4.1、GPT-4o 及图像生成等重要工作。
Shuchao Bi
Shuchao Bi 在 2024 年 5 月加入 OpenAI,现任后训练 - 多模态(Post-training-Multimodal)负责人。此前,他曾担任谷歌的技术主管(Tech Lead Manager)、YouTube 的工程总监。
他本科毕业于浙江大学,硕博毕业于加州大学伯克利分校。
在 OpenAI 期间,他的核心研究方向包括:预训练新范式、多模态推理与高阶计算强化学习、多模态评分模型与评估体系、智能体系统整合、多模态 - 多语言认知协同、具身智能基础模型、多模态蒸馏技术等等。
Hongyu Ren(任泓宇)
Hongyu Ren 现为 OpenAI 研究科学家。他在 2023 年 7 月加入了 OpenAI,此前曾在苹果、谷歌等公司工作过。
他拥有斯坦福大学计算机科学博士学位和北京大学计算机科学荣誉学士学位。
在 OpenAI 期间,他参与创建了 o3-mini、o1-mini,并是 o1 的基础贡献者;此外,他还是 GPT-4o mini 的负责人以及 GPT-4o 的核心贡献者;他还领导了一支后训练团队。
参考链接:
https://www.theinformation.com/articles/meta-hires-four-openai-researchers
https://techcrunch.com/2025/06/28/meta-reportedly-hires-four-more-researchers-from-openai/
https://x.com/Yuchenj_UW/status/1939035068909105289
文章来自微信公众号 “ 机器之心 ”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner