AI资讯新闻榜单内容搜索-模型

调整训练数据出场顺序，大模型就能变聪明！无需扩大模型/数据规模

模型训练重点在于数据的数量与质量？其实还有一个关键因素—— 数据的出场顺序。

来自主题: AI技术研报

6805 点击 2025-09-07 11:26

OpenAI罕见发论文：我们找到了AI幻觉的罪魁祸首

AI 最臭名昭著的 Bug 是什么？不是代码崩溃，而是「幻觉」—— 模型自信地编造事实，让你真假难辨。这个根本性挑战，是阻碍我们完全信任 AI 的关键障碍。

来自主题: AI技术研报

7116 点击 2025-09-07 11:21

深度｜Anthropic为什么要宣布对中国断供？

北京时间9月5日晚，美国AI独角兽Anthropic在其官网发布了一则公告。内容简洁而强硬：其旗下的Claude系列模型，将立即停止向多数股权由中国资本持有的公司提供服务。在熟悉华盛顿政治生态的人看来，这一决绝姿态的背后，与Anthropic创始人达里奥·阿莫迪（Dario Amodei）的个人经历不无关系。

来自主题: AI资讯

10543 点击 2025-09-07 10:36

Nano Banana爆火之后，一个神秘的「胡萝卜」代码模型又上线了

以前，每当上线一个新模型，大家总要绞尽脑汁想个响亮又不撞车的名字。不得不说，有时候名字起得太出彩，甚至能把模型本身给卷下去。别人还没搞懂它能干嘛，名字已经在朋友圈刷屏了。

来自主题: AI资讯

7190 点击 2025-09-06 12:59

OpenAI 不想再「跪着」买显卡了

《金融时报》最新消息，OpenAI 正在和博通合作，自研一颗代号 “XPU” 的 AI 推理芯片，预计会在 2026 年量产，由台积电代工。不同于英伟达的 GPU，这款芯片不会对外销售，而是专门满足 OpenAI 内部的训练与推理需求，用来支撑即将上线的 GPT-5 等更庞大的模型。

来自主题: AI资讯

9116 点击 2025-09-06 12:50

视频理解新标杆，快手多模态推理模型开源：128k上下文+0.1秒级视频定位+跨模态推理

能看懂视频并进行跨模态推理的大模型Keye-VL 1.5，快手开源了。

来自主题: AI技术研报

7869 点击 2025-09-06 12:44

沉寂一个月，openPangu性能飙升8%！华为1B开源模型来了

在端侧 AI 这个热门赛道，华为盘古大模型扔下了一颗 “重磅炸弹” 。

来自主题: AI技术研报

8488 点击 2025-09-06 12:28

多模态大模型持续学习系列研究，综述+Benchmark+方法+Codebase一网打尽！

近年来，生成式 AI 和多模态大模型在各领域取得了令人瞩目的进展。然而，在现实世界应用中，动态环境下的数据分布和任务需求不断变化，大模型如何在此背景下实现持续学习成为了重要挑战

来自主题: AI技术研报

8564 点击 2025-09-06 11:50

长视频生成可以回头看了！牛津提出「记忆增稳」，速度提升12倍

VMem用基于3D几何的记忆索引替代「只看最近几帧」的短窗上下文：检索到的参考视角刚好看过你现在要渲染的表面区域；让模型在小上下文里也能保持长时一致性；实测4.2s/帧，比常规21帧上下文的管线快~12倍。

来自主题: AI技术研报

7484 点击 2025-09-06 11:43

断供？会“刻意练习”的Qwen2.5-3B，竟然超越Claude3.5！斯坦福最新

来自斯坦福的研究者们最近发布的一篇论文（https://arxiv.org/abs/2509.01684）直指RL强化学习在机器学习工程（Machine Learning Engineering）领域的两个关键问题，并克服了它们，最终仅通过Qwen2.5-3B便在MLE任务上超越了仅依赖提示（prompting）的、规模更大的静态语言模型Claude3.5。

来自主题: AI资讯

7848 点击 2025-09-06 11:35