AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

冗长响应缩减80%，DeepSeek GRPO获得颠覆性改进，微软GFPO问世

冗长响应缩减80%，DeepSeek GRPO获得颠覆性改进，微软GFPO问世

冗长响应缩减80%，DeepSeek GRPO获得颠覆性改进，微软GFPO问世

用过 DeepSeek-R1 等推理模型的人，大概都遇到过这种情况：一个稍微棘手的问题，模型像陷入沉思一样长篇大论地推下去，耗时耗算力，结果却未必靠谱。现在，我们或许有了解决方案。

来自主题: AI技术研报

7011 点击 2025-08-15 11:26

ICCV 2025 | HERMES：首个统一3D场景理解与生成的世界模型

ICCV 2025 | HERMES：首个统一3D场景理解与生成的世界模型

ICCV 2025 | HERMES：首个统一3D场景理解与生成的世界模型

在复杂的城市场景中，HERMES 不仅能准确预测未来三秒的车辆与环境动态（如红圈中标注的货车），还能对当前场景进行深度理解和问答（如准确识别出 “星巴克” 并描述路况）。

来自主题: AI技术研报

7764 点击 2025-08-15 11:10

LLM幻觉第一次被定义：你必须掌握的3个理论和能上手的4套工程解法

LLM幻觉第一次被定义：你必须掌握的3个理论和能上手的4套工程解法

LLM幻觉第一次被定义：你必须掌握的3个理论和能上手的4套工程解法

幻觉，作为AI圈家喻户晓的概念，这个词您可能已经听得耳朵起茧了。我们都知道它存在，也普遍接受了它似乎无法根除，是一个“老大难”问题。但正因如此，一个更危险的问题随之而来：当我们对幻觉的存在习以为常时，我们是否也开始对它背后的系统性风险变得麻木？我们是真的从第一性原理上理解了它，还是仅仅在用一个又一个的补丁（比如RAG）来被动地应对它？

来自主题: AI资讯

7977 点击 2025-08-15 11:03

写在GPT-5风波之后：为什么AI的智商和情商不可兼得？

写在GPT-5风波之后：为什么AI的智商和情商不可兼得？

写在GPT-5风波之后：为什么AI的智商和情商不可兼得？

GPT-5和“还我GPT-4o”的风波，闹得沸沸扬扬。今天，奥特曼还有一次认怂了，不仅调了UI，还把o3这些老模型还了回来。

来自主题: AI资讯

6932 点击 2025-08-15 10:46

告别Transformer，重塑机器学习范式：上海交大首个「类人脑」大模型诞生

告别Transformer，重塑机器学习范式：上海交大首个「类人脑」大模型诞生

告别Transformer，重塑机器学习范式：上海交大首个「类人脑」大模型诞生

当前 GPT 类大语言模型的表征和处理机制，仅在输入和输出接口层面对语言元素保持可解释的语义映射。相比之下，人类大脑直接在分布式的皮层区域中编码语义，如果将其视为一个语言处理系统，它本身就是一个在全局上可解释的「超大模型」。

来自主题: AI技术研报

7876 点击 2025-08-14 11:11

华人团队终结Token危机：扩散模型数据潜力超自回归三倍

华人团队终结Token危机：扩散模型数据潜力超自回归三倍

华人团队终结Token危机：扩散模型数据潜力超自回归三倍

Token危机真的要解除了吗？最新研究发现，在token数量受限的情况下，扩散语言模型的数据潜力可达自回归模型的三倍多。

来自主题: AI资讯

8692 点击 2025-08-14 10:40

OpenAI没开源的gpt-oss基础模型，他去掉强化学习逆转出来了

OpenAI没开源的gpt-oss基础模型，他去掉强化学习逆转出来了

OpenAI没开源的gpt-oss基础模型，他去掉强化学习逆转出来了

前些天，OpenAI 少见地 Open 了一回，发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。

来自主题: AI资讯

7258 点击 2025-08-13 18:19

AI顶会模式出了问题？「不发表，就出局」的恶性循环，正在压垮整个AI学界

AI顶会模式出了问题？「不发表，就出局」的恶性循环，正在压垮整个AI学界

AI顶会模式出了问题？「不发表，就出局」的恶性循环，正在压垮整个AI学界

相信我们的读者都对 AI 顶会有非常大的关注和热情，有的读者最近可能刚从 NeurIPS rebuttal 脱身，又开始为下一篇做准备了。作为推动技术革新与思想碰撞的核心引擎，顶级学术会议不仅是整个学界的生命线，更是我们洞察未来的前沿阵地。

来自主题: AI技术研报

6948 点击 2025-08-13 16:41

研究者警告：强化学习暗藏「策略悬崖」危机，AI对齐的根本性挑战浮现

研究者警告：强化学习暗藏「策略悬崖」危机，AI对齐的根本性挑战浮现

研究者警告：强化学习暗藏「策略悬崖」危机，AI对齐的根本性挑战浮现

强化学习（RL）是锻造当今顶尖大模型（如 OpenAI o 系列、DeepSeek-R1、Gemini 2.5、Grok 4、GPT-5）推理能力与对齐的核心 “武器”，但它也像一把双刃剑，常常导致模型行为脆弱、风格突变，甚至出现 “欺骗性对齐”、“失控” 等危险倾向。

来自主题: AI技术研报

8534 点击 2025-08-13 16:29

o3 Gemini 都翻车？首个可验证长链 GUI 数据集 VeriGUI 重磅开源，探索通用 Agent 能力边界

o3 Gemini 都翻车？首个可验证长链 GUI 数据集 VeriGUI 重磅开源，探索通用 Agent 能力边界

o3 Gemini 都翻车？首个可验证长链 GUI 数据集 VeriGUI 重磅开源，探索通用 Agent 能力边界

GUI 智能体正以前所未有的速度崛起，有望彻底改变人机交互的方式。然而，这一领域的进展正面临瓶颈：现有数据集大多聚焦于 10 步以内的短程交互，且仅验证最终结果，无法有效评估和训练智能体在真实世界中的长时程规划与执行能力。

来自主题: AI资讯

7836 点击 2025-08-13 16:17

上一页当前第110页,共343页下一页