AI资讯新闻榜单内容搜索-Moe

OpenAI突然开源1200亿参数MoE模型！专家连夜解码发现：Hidden Size=2880藏惊天陷阱，第3条让GPU厂商集体崩溃！

gpt5来临前夕，oai疑似发布的小模型gpt-oss 120B的架构图已经满天飞了。难得openai要open一次，自然调动了我的全部注意力机制。本来以为oai还要掏出gpt2意思意思，结果看到了一个120B moe。欸？！

来自主题: AI资讯

9843 点击 2025-08-04 15:03

万亿参数狂欢！一文刷爆2025年七大顶流大模型架构

从GPT-2到DeepSeek-V3和Kimi K2，架构看似未变，却藏着哪些微妙升级？本文深入剖析2025年顶级开源模型的创新技术，揭示滑动窗口注意力、MoE和NoPE如何重塑效率与性能。

来自主题: AI技术研报

8406 点击 2025-08-04 12:05

阿里开源电影级AI视频模型！MoE架构，5B版本消费级显卡可跑

电影级视频生成模型来了。

来自主题: AI资讯

10296 点击 2025-07-29 12:49

只需一次指令微调，大模型变身全能专家天团，8B模型性能反超全微调基线 | ACL25 Oral

只需一次指令微调，即可让普通大模型变身“全能专家天团”？

来自主题: AI技术研报

7947 点击 2025-07-29 10:45

Step-3 发布：包括发布会上没说的，都在这了

今天下午，阶跃星辰在 WAIC 2025 开幕前夕发布新一代基础大模型 Step 3，并宣布将在 7 月 31 日面向全球企业和开发者开源。MoE 架构，321B 总参，38B 激活

来自主题: AI资讯

10014 点击 2025-07-25 23:25

Kimi K2模型API性能优化进行时：月之暗面积极应对高负载挑战

近日，月之暗面(Moonshot AI)正式发布了其万亿参数开源大模型Kimi K2，这一具有里程碑意义的AI模型凭借其创新的MoE架构和强大的Agentic能力迅速获得全球开发者关注。然而，随着用户量激增，部分开发者开始反映其API服务响应速度不尽如人意。面对这一情况，月之暗面于7月15日迅速作出官方回应，坦诚当前服务延迟问题，并详细说明了优化方案。

来自主题: AI资讯

9050 点击 2025-07-21 12:18

AI圈水太深：OpenAI保密、Meta作弊！国产MoE却异军突起

从GPT-2到Llama 4，大模型这几年到底「胖」了多少？从百亿级密集参数到稀疏MoE架构，从闭源霸权到开源反击，Meta、OpenAI、Mistral、DeepSeek……群雄割据，谁能称王？

来自主题: AI技术研报

8365 点击 2025-07-16 16:18

独家：Kimi悄悄发布了全球首个参数量达到1万亿的K2模型

结果点进去一看，我人直接傻了——这家伙用的竟然是 kimi-k2-0711-preview 模型！这个K2模型的简直离谱到家了：业界第一个说自己是1万亿参数的模型，这规模直接吓人 MoE架构 + 32B激活参数

来自主题: AI资讯

9752 点击 2025-07-11 18:38

用MoE打造DNA基础模型更强范式！人大实现seq2func全新突破

中国人民大学高瓴人工智能学院的研究团队提出通过创新模型架构来提升性能，其SPACE模型引入新架构，提升了DNA基础模型的性能与泛化能力，在多项测试中表现优异。

来自主题: AI资讯

9669 点击 2025-07-11 16:59

华为盘古大模型“抄袭”阿里Qwen？官方回应

7月5日下午16:59分，隶属于华为的负责开发盘古大模型的诺亚方舟实验室发布声明对于“抄袭”指控进行了官方回应。诺亚方舟实验室表示，盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型，并非基于其他厂商模型增量训练而来，在架构设计、技术特性等方面做了关键创新，是全球首个面向昇腾硬件平台设计的同规格混合专家模型

来自主题: AI资讯

10429 点击 2025-07-06 11:06