xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了
7817点击    2026-05-09 13:17

刚刚,xAI再失一名华人大将。


就在今天,预训练负责人庄钧堂官宣了自己的离职消息。


xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了


此前,庄钧堂已经在xAI工作了两年。


这期间,他主导了从Grok 2到Grok 5的全系列预训练,同时负责Grok在X和Tesla上的语音模型及xAI企业API模型。


同时,他的离开,也是xAI不再独立运营后,新一轮离职潮的一个缩影。


仅今天一天,就有多名员工相继宣布离职。


如此高密度的人员离职,让人不禁感叹,xAI到底是怎么了?


xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了


谁是庄钧堂?


2024年,庄钧堂加入xAI。


此后两年,Grok 2、Grok 3、Grok 4、Grok 5,每一代模型的预训练都由他主导。


Grok在X和Tesla上的语音模型,xAI对外的企业API模型,也都出自他手。


在此之前,他在OpenAI工作了三年。


这期间,他是GPT-4技术报告的联合作者,还参与了GPT-4o的核心开发、主导完成了DALL-E 3,并作为首位贡献者搭建了OpenAI的Embedding模型。


这四件事,分别对应着OpenAI在语言模型、多模态、图像生成和向量检索四个方向上的关键节点产品。


xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了


他的学术背景,和这份工作履历放在一起,有一定的反差。


庄钧堂本科就读于清华大学,但读的专业并非计算机,而是工程物理,还辅修了法律。


他的硕博生涯是在耶鲁度过的,硕士读的是统计学,博士则是生物医学工程。


读博期间,庄郡堂的研究课题是判断自闭症患者的脑连接组中哪些连接异常与自闭症的诊断相关。


在这个课题中,他使用的工具是神经网络。


xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了


在博士期间,他提出了AdaBelief优化器,其核心思路是根据模型对当前梯度的置信程度来自适应地调整步长。


如果当前观测到的梯度方向与模型的预期偏差很大,说明此刻的观测不可信,应该迈小步;如果梯度方向与预期接近,说明信号可靠,可以迈大步。


这个设计触及了深度学习训练中一个长期存在的痛点——现有优化器对噪声梯度的处理过于粗糙。


这篇论文在NeurIPS 2020拿到了Spotlight,随后被PyTorch、TensorFlow、Google Flax、DeepMind Optax等主流框架相继收录,成为研究者工具箱里的常备选项。


马斯克留不住人


就在庄钧堂宣布离职的同一天,xAI还有多名员工相继发出了同样的消息。


三天前,马斯克刚刚宣布xAI不再作为独立公司运营,并入SpaceX,统一更名为“SpaceXAI”。这个消息发出后没多久,离职的消息就接连来了。


xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了


与此同时,另一批人正在进场——Cursor的员工开始出现在xAI的办公室里,由xAI现任研究负责人Aman Madaan主持联合会议。


Cursor的到来,目的之一就是解决马斯克一直以来“留不住人”的困境。


从2024年中开始,xAI的联创就在陆续离开,SpaceX完成收购后密集爆发,到今年3月底,11位联创全部清零。


Fast Company统计,过去一年内xAI可查证的离职员工已超过80人。


马斯克也在试图解决人事危机,但专门挖来的人也是说走就走。


今年3月,马斯克把Mistral AI和Thinking Machines Lab联创Devendra Chaplot请来,直接向他汇报,但Debendra入职才一个月,便离职了。


马斯克承认,xAI“没有建立在正确的基础上,正在从头重建”。今年4月,他转向外部,与Cursor达成合作,于是便有了Cursor员工进驻xAI办公室的一幕。


Grok正常更新


尽管马斯克在人事问题上屡遭滑铁卢,但xAI的主要产品Grok,也刚刚宣布了一波更新。


新版增加了连接器功能,支持接入邮件、日历、Notion等工具,帮助用户提取邮件、整理日程。


xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了


同时马斯克还下场驳斥了“Grok将死”的传闻。


毕竟一边是团队不再独立运行,另一边又刚刚把Colossus集群租给了Anthropic,让人很难不遐想。


但马斯克表示,新的Grok模型正在Colossus 2集群上正常训练中,也算是解开了Colossus出租的疑云。


xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了


那就等着看看,马斯克还能交出怎样的模型吧。


参考链接:

[1]https://x.com/archanfel_anoth/status/2052878350868484361

[2]https://x.com/elonmusk/status/2052269744120869106


文章来自于微信公众号 "量子位",作者 "量子位"

关键词: AI新闻 , xAI , 庄钧堂 , AI大厂
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

2
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/