AI资讯新闻榜单内容搜索-模型训练

比GPT-5还准？AIME25飙到99.9%刷屏，开源模型首次！

DeepConf由Meta AI与加州大学圣地亚哥分校提出，核心思路是让大模型在推理过程中实时监控置信度，低置信度路径被动态淘汰，高置信度路径则加权投票，从而兼顾准确率与效率。在AIME 2025上，它首次让开源模型无需外部工具便实现99.9%正确率，同时削减85%生成token。

来自主题: AI技术研报

6503 点击 2025-08-23 16:12

让AI作画自己纠错！随机丢模块就能提升生成质量，告别塑料感废片

AI作画、生视频，可以「自己救自己」了？！当大家还在为CFG（无分类器引导）的参数搞到头秃，却依然得到一堆“塑料感”废片而发愁时，来自清华大学、阿里巴巴AMAP（高德地图）、中国科学院自动化研究所的研究团队，推出全新方法S²-Guidance (Stochastic Self-Guidance)。

来自主题: AI技术研报

5106 点击 2025-08-23 16:04

Chain-of-Agents: OPPO推出通用智能体模型新范式，多榜单SOTA，模型代码数据全开源

近年来，以多智能体系统（MAS）为代表的研究取得了显著进展，在深度研究、编程辅助等复杂问题求解任务中展现出强大的能力。现有的多智能体框架通过多个角色明确、工具多样的智能体协作完成复杂任务，展现出明显的优势。

来自主题: AI技术研报

5092 点击 2025-08-23 15:50

自主深度研究DR代理究竟走向何方？四步操作「流程」让你不迷糊 |华为最新

华为诺亚方舟实验室最近联合香港大学发了一篇针对"Deep Research Agents"（深度研究代理）的系统性综述，在我的印象中，这是他们第二次发布关于Deep Research的综述论文。上一篇里提供了一个结构导向 (Structure-Oriented) 的视角，核心是“分类”。

来自主题: AI资讯

6068 点击 2025-08-23 12:02

上下文即记忆！港大&快手提出场景一致的交互式视频世界模型，记忆力媲美Genie3，且更早问世！

AI生成的人物和场景转头就变样，缺乏一致性？ nonono，这回不一样了，康康下面的demo！游戏地图：《塞尔达传说》中的绿色田野

来自主题: AI资讯

5994 点击 2025-08-23 11:54

KDD 2025 Best Paper Runner-Up | EI-BERT：超紧凑语言模型压缩框架

在移动计算时代，将高效的自然语言处理模型部署到资源受限的边缘设备上面临巨大挑战。这些场景通常要求严格的隐私合规、实时响应能力和多任务处理功能。

来自主题: AI技术研报

5751 点击 2025-08-23 11:47

GPT-5变蠢背后：抑制AI的幻觉，反而让模型没用了？

OpenAI的GPT-5因大幅降低AI幻觉而被批"变蠢"，输出呆板创造力减弱，反映出幻觉降低限制模型灵活性。对话嘉宾甄焱鲲分析幻觉本质无法根除，需辩证看待，并探讨类型分5类、缓解方法如In-Context-Learning及RAG，影响企业应用场景的容忍度与决策，强调未来模型或通过世界模型深化理解。

来自主题: AI资讯

7276 点击 2025-08-23 10:32