AI资讯新闻榜单内容搜索-模型

昇腾+鲲鹏联手上大招！华为爆改MoE训练，吞吐再飙升20%，内存省70%

最近，华为在MoE训练系统方面，给出了MoE训练算子和内存优化新方案：三大核心算子全面提速，系统吞吐再提20%，Selective R/S实现内存节省70%。

来自主题: AI技术研报

8288 点击 2025-06-04 15:17

速递｜斯坦福90后中国数学博士的AI公司，未出产品先融资5000万美元，B Capital正洽谈领投

数学家们一直痴迷于能够解决复杂数学问题的人工智能。OpenAI 等机构开发这些模型的部分开发者认为，学会解决数学难题的 AI 可以运用相似的推理方法来解决其他类型的问题。但由于当前的人工智能尚未证明能在高等数学领域超越人类专家，一些创业者看到了开发专业数学模型的机遇。

来自主题: AI资讯

7868 点击 2025-06-04 14:36

AI应该取代不了我…吧？

当AI开始写报告、做播客、生成视频，内容创作者还剩什么优势？

来自主题: AI资讯

8105 点击 2025-06-04 14:31

靠人脉吃饭的零一万物，能撑多久？

实践出真知

来自主题: AI资讯

10277 点击 2025-06-04 14:25

Meta新突破！跨模态生成告别噪声：流匹配实现任意模态无缝流转

在人工智能领域，跨模态生成（如文本到图像、图像到文本）一直是技术发展的前沿方向。现有方法如扩散模型（Diffusion Models）和流匹配（Flow Matching）虽取得了显著进展，但仍面临依赖噪声分布、复杂条件机制等挑战。

来自主题: AI技术研报

8665 点击 2025-06-04 14:18

重磅开源！首个全异步强化学习训练系统来了，SOTA推理大模型RL训练提速2.77倍

想训练属于自己的高性能推理模型，却被同步强化学习（RL）框架的低效率和高门槛劝退？AReaL 全面升级，更快，更强，更好用！

来自主题: AI技术研报

8123 点击 2025-06-04 14:05

冲击自回归，扩散模型正在改写下一代通用模型范式

上个月 21 号，Google I/O 2025 开发者大会可说是吸睛无数，各种 AI 模型、技术、工具、服务、应用让人目不暇接。在这其中，Gemini Diffusion 绝对算是最让人兴奋的进步之一。从名字看得出来，这是一个采用了扩散模型的 AI 模型，而这个模型却并非我们通常看到的扩散式视觉生成模型，而是一个地地道道的语言模型！

来自主题: AI技术研报

8614 点击 2025-06-04 14:04

网友晒 21 页 PDF 质疑 Grok 3 套壳 Claude，Grok 3 自己承认了！xAI 工程师被喷无能

近日，一位 ID 名为 GpsTracker 的网友在网上爆料称，埃隆·马斯克旗下 xAI 公司最新发布的 Grok 3 人工智能模型存在异常行为——当用户激活其“思考模式”提问时，模型竟自称是竞争对手 Anthropic 公司开发的 Claude 3.5 模型。

来自主题: AI资讯

8100 点击 2025-06-04 11:37

LeCun新作反杀AGI派！AI连「鸟」都搞不懂，拿什么超越人类？

LLM根本不会思考！LeCun团队新作直接戳破了大模型神话。最新实验揭示了，AI仅在粗糙分类任务表现优秀，却在精细任务中彻底失灵。

来自主题: AI技术研报

8156 点击 2025-06-04 11:06

AI资讯新闻榜单内容搜索-模型

昇腾+鲲鹏联手上大招！华为爆改MoE训练，吞吐再飙升20%，内存省70%

最新发现！每参数3.6比特，语言模型最多能记住这么多

速递｜斯坦福90后中国数学博士的AI公司，未出产品先融资5000万美元，B Capital正洽谈领投

AI应该取代不了我…吧？

靠人脉吃饭的零一万物，能撑多久？

Meta新突破！跨模态生成告别噪声：流匹配实现任意模态无缝流转

重磅开源！首个全异步强化学习训练系统来了，SOTA推理大模型RL训练提速2.77倍

冲击自回归，扩散模型正在改写下一代通用模型范式

网友晒 21 页 PDF 质疑 Grok 3 套壳 Claude，Grok 3 自己承认了！xAI 工程师被喷无能

LeCun新作反杀AGI派！AI连「鸟」都搞不懂，拿什么超越人类？