AI资讯新闻榜单内容搜索-MoE大模型

罗福莉首秀前，小米突然发布！代码全球最强，总体媲美DeepSeek-V3.2【附实测】

今天，小米发布并开源了最新MoE大模型MiMo-V2-Flash，总参数309B，激活参数15B。今日上午，小米2025小米人车家全生态合作伙伴大会上，Xiaomi MiMO大模型负责人罗福莉将首秀并发布主题演讲。

来自主题: AI资讯

8686 点击 2025-12-17 09:41

每2秒吃透一道高数大题！华为终于揭秘准万亿MoE昇腾训练系统全流程

现在，请大家一起数一下“1”、“2”。OK，短短2秒钟时间，一个准万亿MoE大模型就已经吃透如何解一道高等数学大题了！而且啊，这个大模型还是不用GPU来训练，全流程都是大写的“国产”的那种。

来自主题: AI技术研报

10138 点击 2025-05-31 14:11

还得是华为！Pangu Ultra MoE架构：不用GPU，你也可以这样训练准万亿MoE大模型

Pangu Ultra MoE 是一个全流程在昇腾 NPU 上训练的准万亿 MoE 模型，此前发布了英文技术报告[1]。最近华为盘古团队发布了 Pangu Ultra MoE 模型架构与训练方法的中文技术报告，进一步披露了这个模型的细节。

来自主题: AI技术研报

10302 点击 2025-05-29 16:47

Dense与MoE大模型架构后续发展解读

过去十年，自然语言处理领域经历了从统计语言模型到大型语言模型（LLMs）的飞速发展。

来自主题: AI技术研报

12434 点击 2025-03-28 09:45

猎户星空发布MoE大模型，推出AI数据宝AirDS

11月27日，猎户星空联合聚云科技举办了题为《Data Ready for Al，MoE大模型发布暨商业闭环分享》媒体见面会。猎户星空正式发布了自主研发的Orion-MoE 8×7B大模型，并携手聚云科技推出了基于该大模型的数据服务—AI数据宝AirDS（AI-Ready Data Service）。

来自主题: AI资讯

10312 点击 2024-11-28 10:12