Meta FAIR田渊栋唯一作者发文:拆解模型「顿悟时刻」
Meta FAIR田渊栋唯一作者发文:拆解模型「顿悟时刻」早在 2021 年,研究人员就已经发现了深度神经网络常常表现出一种令人困惑的现象,模型在早期训练阶段对训练数据的记忆能力较弱,但随着持续训练,在某一个时间点,会突然从记忆转向强泛化。
早在 2021 年,研究人员就已经发现了深度神经网络常常表现出一种令人困惑的现象,模型在早期训练阶段对训练数据的记忆能力较弱,但随着持续训练,在某一个时间点,会突然从记忆转向强泛化。
我惊! 图灵奖得主、AI三巨头之一的LeCun在Meta待得是如坐针毡。 Yann LeCun已经直接跟同事表示,自己可能会辞去FAIR首席科学家的职务。
Anthropic宣布任命前Stripe CTO Rahul Patil为新任首席技术官,此次换帅旨在强化Anthropic的AI基础设施,以应对Claude产品快速增长带来的算力和能耗压力。同时,也是为了面对OpenAI和Meta数千亿美元级的基础设施投入而进行的一次战略调整。
一次咖啡馆中的谈话,诞生了一家估值3亿美元的创业公司!2024年,仍为斯坦福大学博士生的Carina Hong与前Meta的AI研究员Shubho Sengupta有过一次数小时的交谈。在那次交谈中二人探讨了如何用AI来解决数学领域的难题。
9 月 25 日,白鲸出海携手 Meta、Adjust 特别策划的鲸英会第三十三期 ——「AI+APP=∞」产品 Mix 迸发新惊喜如期在北京举行。来自 Meta 及其国内代理、Adjust 等众多出海行业和政策专家,以及 40 多位中国头部 AI 创企 CXO
扎克伯格又从 OpenAI 挖走了一位华人科学家,而且这位称得上是「超级大脑」。本周四午间传来消息,原 OpenAI 战略探索团队负责人宋飏(Yang Song)加入 Meta,他成为了新成立的 Meta 超级智能实验室(MSL)研究负责人。
刚刚,Meta又从OpenAI挖来一员猛将——宋飏,扩散模型领域的核心人物,DALL·E 2技术路径的早期奠基者。他已正式加入Meta Superintelligence Labs,担任研究负责人,直接向他的师兄赵晟佳汇报。
H-1B新规,正引发一场全球顶尖人才的争夺赛。黄仁勋、奥特曼等人赞成H-1B新令,但也有人认为,新政策将使美国创业企业遭受打击,限制美国企业获得全球人才的能力。
刚刚,Meta FAIR推出了代码世界模型!CWM(Code World Model),一个参数量为32B、上下文大小达131k token的密集语言模型,专为代码生成和推理打造的研究模型。这是全球首个将世界模型系统性引入代码生成的语言模型。
就在上周的 Meta Connect 开发者大会上,Meta 发布了三款全新智能眼镜,但本该展示“未来体验”的现场演示却屡屡翻车。Bosworth 随后在 Instagram 上火速澄清,否认了小扎的说法。他坦言,这不是 Wi-Fi 的问题,也不是场地的原因,而是 Meta 自己的设置和失误。