当马斯克OpenAI算力军备赛打响,中国最大国产AI算力池来了!
当马斯克OpenAI算力军备赛打响,中国最大国产AI算力池来了!昨日,由中科曙光提供的3套scaleX万卡超集群系统,在国家超算互联网核心节点同时上线试运行。这是国内第一次在国家级算力枢纽节点上,同步部署并实际投入运营3套万卡级AI超集群,一举成为全国首个实现超3万卡部署、且已进入实际运营阶段的最大国产AI算力池。
昨日,由中科曙光提供的3套scaleX万卡超集群系统,在国家超算互联网核心节点同时上线试运行。这是国内第一次在国家级算力枢纽节点上,同步部署并实际投入运营3套万卡级AI超集群,一举成为全国首个实现超3万卡部署、且已进入实际运营阶段的最大国产AI算力池。
今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 —— SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。
专注于挑战思科系统和博通公司的网络初创企业Upscale AI 完成 2 亿美元融资轮,使公司估值突破 10 亿美元大关。 Upscale 周三宣布本轮融资由老虎环球管理、普雷姆吉投资和 Xora 创新领投,其他投资者包括 Maverick Silicon、StepStone 集团、梅菲尔德、Prosperity7 风投、英特尔资本和高通风投。
文本领域的大模型满分选手,换成语音就集体挂科?大模型引以为傲的多轮对话逻辑,在真实人声面前竟然如此脆弱。Scale AI正式发布首个原生音频多轮对话基准Audio MultiChallenge,直接撕开了大模型靠合成语音评测维持的优等生假象。实验显示,强如Gemini 3 Pro在真实场景下的通过率也仅过半数,而GPT-4o Audio的表现更是令人大跌眼镜。
近日,来自 Meta、香港科技大学、索邦大学、纽约大学的一个联合团队基于 JEPA 打造了一个视觉-语言模型:VL-JEPA。据作者 Pascale Fung 介绍,VL-JEPA 是第一个基于联合嵌入预测架构,能够实时执行通用领域视觉-语言任务的非生成模型。
提起马卡龙,你会想到什么?是橱窗里的精致甜点,一种“少女心”的味觉象征?还是代表了温柔优雅的时尚配色?当一个AI产品也被命名为“马卡龙”,这份联想便悄然发生了偏移:从舌尖的甜,转向科技的未知,却又奇妙地保留了那一份色彩与气质。
自动驾驶数据荒怎么破?
AI训练背后,正在上演一场新的「华尔街迁徙」!前银行家纷纷化身AI导师,用自己的专业知识帮助OpenAI、xAI、Scale AI等AI公司训练模型,华尔街精英正在成为AI重塑华尔街的幕后推手。
最新PRBench基准可以测试AI在金融和法律领域的表现。结果显示,即使是顶尖大模型在处理复杂任务时也表现不佳,尤其在涉及重大经济后果的任务中。PRBench通过模拟真实场景和多轮对话,揭示了AI在专业领域的不足,强调开发更可靠AI系统的重要性。
在基础模型领域,模型规模与性能之间的缩放定律(Scaling Law)已被广泛验证,但模型增大也伴随着训练成本、存储需求和能耗的急剧上升。如何在控制参数量的前提下高效扩展模型,成为当前研究的关键挑战。