美团 LongCat-2.0:第一个在纯国产芯片训练的万亿参数大模型
美团 LongCat-2.0:第一个在纯国产芯片训练的万亿参数大模型如果只看标题,它很容易被归到“又一个万亿参数大模型”的队伍里:1.6 万亿总参数、MoE 架构、100 万 token 上下文、面向代码和 Agent 场景。但这次真正值得看的,不只是模型有多大,而是它背后的三个问题:国产算力能不能支撑前沿级大模型训练?
搜索
如果只看标题,它很容易被归到“又一个万亿参数大模型”的队伍里:1.6 万亿总参数、MoE 架构、100 万 token 上下文、面向代码和 Agent 场景。但这次真正值得看的,不只是模型有多大,而是它背后的三个问题:国产算力能不能支撑前沿级大模型训练?
随着全球智能体加速落地,算力需求呈指数级爆发,以 GPU 为核心的 AI 基础设施正变得愈发关键。据摩根士丹利报告预测,2028 年全球 AI 基础设施累计总投资将达 2.9 万亿美元。
2026年6月,全球AI算力产业最焦虑的事情,不是英伟达Rubin能不能按时出货,也不是台积电CoWoS产能够不够——而是一台大多数人根本没听说过的机器:日本丰田工业的喷气织布机。
清华系物理AI企业「清研精准」已于近日完成数亿元B3轮融资,本轮融资由北京市绿色能源基金、北汽产投领投,裕隆集团跟投。据悉,该轮资金将会用于核心人才招募、多模态数采设备的研发与规模化部署,以及算力采购与模型训练基础设施建设等方向。
全球最昂贵的浪费,正发生在最聪明的公司里。当你正 Vibe Coding 嗨到不行,或者跑着的项目突然停摆,打开 CLI 工具一看,「你的额度已用完」字样出现时,心态不崩是不可能的。
如果我们谈到 AI 赋能带来的科学突破,AlphaFold 一定是不可忽略的一项。它解决了困扰生物学界半个多世纪的蛋白质折叠难题,大量压缩了得到蛋白质结构的时间,从原来的一年,到现在的几分钟。它的核心开发者之一 John Jumper 也因这一贡献在 2024 年摘得诺贝尔化学奖。
Harsh Mehta 在 Anthropic 的时候,启动了一个后来被称为 autoresearch 的内部平台(不是 Karpathy 那个)。最初这个项目只有他一个人,功能是让 AI 自主完成 AI 研发中的一系列流程环节:提出实验假设、编写代码、调度算力、评估结果,再决定下一步做什么。
非手机业务目标400亿美元,“飞龙”进入数据中心,高通这次整了个大的。
一场关于「去哪里找电」的全球竞赛,正在朝两个方向展开。
AI进军物理世界!海光携手同济大学,落地全国首个国产千卡工科智算集群,让国产算力不仅懂科学,更懂精密工程。从实验室走向大国重器,AI4E时代正式开启。