小米推出首个开源推理大模型 Mimo
小米推出首个开源推理大模型 Mimo今天上午,小米发布了其首个开源推理大模型-Xiaomi MiMo。通过 25 T 预训练 + MTP 加速 + 规则化 RL + Seamless Rollout,让 7 B 参数的 MiMo-7B 在数理推理和代码生成上赶超 30 B-32 B 大模型,并完整 MIT 开源全系列与工程链,给端-云一体 AI 落地提供了“以小博大”的新范例。
今天上午,小米发布了其首个开源推理大模型-Xiaomi MiMo。通过 25 T 预训练 + MTP 加速 + 规则化 RL + Seamless Rollout,让 7 B 参数的 MiMo-7B 在数理推理和代码生成上赶超 30 B-32 B 大模型,并完整 MIT 开源全系列与工程链,给端-云一体 AI 落地提供了“以小博大”的新范例。
4月29日圣何塞现场报道,今日,在2025英特尔代工大会(Intel Foundry Direct Connect)上,英特尔CEO陈立武携多位英特尔代工高管分享了多代核心制程和先进封装的技术进展、生态合作及未来战略,展露面向AI时代提供系统级代工的雄心。芯东西从大会前排发来一手报道。
香港英文媒体《南华早报》29日援引两名知情人士的话报道称,微软研究院纽约实验室的高级研究员兰姆(Alex Lamb)将于即将到来的秋季学期加入新成立的清华大学人工智能学院(College of AI),担任助理教授。兰姆在一封电子邮件中证实了这一消息。
4月28日,一家名为Lightrun 的以色列初创公司宣布完成 7000 万美元的 B 轮融资。该公司开发了一个可观测性平台,旨在问题出现前识别并调试、修复代码。这笔融资不仅凸显了市场对此类工具的迫切需求,也证明了 Lightrun 在满足这一需求上的强劲势头。
在以 transformer 模型为基础的大模型中,键值缓存虽然用以存代算的思想显著加速了推理速度,但在长上下文场景中成为了存储瓶颈。为此,本文的研究者提出了 MILLION,一种基于乘积量化的键值缓存压缩和推理加速设计。
花429美元购买一个AI虚拟伴侣,这个市场机会有多大?
AI 版本的「什么值得买」。
一觉醒来,全球开源的王座更替了,不是 R2。好消息是,中国用户依然是最大的受益者。
多模态大模型(MLLMs)在视觉理解与推理等领域取得了显著成就。然而,随着解码(decoding)阶段不断生成新的 token,推理过程的计算复杂度和 GPU 显存占用逐渐增加,这导致了多模态大模型推理效率的降低。
在全球 AI 人才争夺战愈演愈烈的今天,许多技术人却不得不面对一种无力的现实。最近,OpenAI 的一位核心研究员 Kai Chen,因绿卡申请被拒,不得不离开美国,这一消息在科技圈引发了广泛关注。