AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

AI看图一本正经胡说八道？「一拉一推」让模型看得全又准｜微软x清华

AI看图一本正经胡说八道？「一拉一推」让模型看得全又准｜微软x清华

AI看图一本正经胡说八道？「一拉一推」让模型看得全又准｜微软x清华

随着视觉-语言模型（VLM）推理能力不断增强，一个隐蔽的问题逐渐浮现：很多错误不是推理没做好，而是“看错了”。

来自主题: AI技术研报

8020 点击 2026-02-09 14:56

先解行为，再训Agent：CMU开源首份Agentic Search日志数据，把Agent拆开给你看

先解行为，再训Agent：CMU开源首份Agentic Search日志数据，把Agent拆开给你看

先解行为，再训Agent：CMU开源首份Agentic Search日志数据，把Agent拆开给你看

在大模型驱动的 Agentic Search 日益常态化的背景下，真实环境中智能体 “如何发查询、如何改写、是否真正用上检索信息” 一直缺乏系统刻画与分析。

来自主题: AI技术研报

8521 点击 2026-02-09 14:55

全新视角看世界模型：从视频生成迈向通用世界模拟器

全新视角看世界模型：从视频生成迈向通用世界模拟器

全新视角看世界模型：从视频生成迈向通用世界模拟器

近年来，视频生成（Video Generation）与世界模型（World Models）已跃升为人工智能领域最炙手可热的焦点。从 Sora 到可灵（Kling），视频生成模型在运动连续性、物体交互与部分物理先验上逐渐表现出更强的「世界一致性」，让人们开始认真讨论：能否把视频生成从「逼真短片」推进到可用于推理、规划与控制的「通用世界模拟器」。

来自主题: AI技术研报

9604 点击 2026-02-09 14:36

模型「漂移」新范式，何恺明新作让生成模型无须迭代推理

模型「漂移」新范式，何恺明新作让生成模型无须迭代推理

模型「漂移」新范式，何恺明新作让生成模型无须迭代推理

训练一个生成模型是很复杂的一件事儿。从底层逻辑上来看，生成模型是一个逐步拟合的过程。与常见的判别类模型不同，判别类模型通常关注的是将单个样本映射到对应标签，而生成模型则关注从一个分布映射到另一个分布。

来自主题: AI技术研报

9175 点击 2026-02-09 14:24

登顶Hugging Face论文热榜，LLM重写数据准备的游戏规则

登顶Hugging Face论文热榜，LLM重写数据准备的游戏规则

登顶Hugging Face论文热榜，LLM重写数据准备的游戏规则

来自上海交通大学、清华大学、微软研究院、麻省理工学院（MIT）、上海 AI Lab、小红书、阿里巴巴、港科大（广州）等机构的研究团队，系统梳理了近年来大语言模型在数据准备流程中的角色变化，试图回答一个业界关心的问题：LLM 能否成为下一代数据管道的「智能语义中枢」，彻底重构数据准备的范式？

来自主题: AI技术研报

8514 点击 2026-02-09 11:12

人形机器人的真机强化学习! ICLR 2026 通研院提出人形机器人预训练与真机微调新范式

人形机器人的真机强化学习! ICLR 2026 通研院提出人形机器人预训练与真机微调新范式

人形机器人的真机强化学习! ICLR 2026 通研院提出人形机器人预训练与真机微调新范式

目前，人形机器人已经能在现实中跳舞、奔跑、甚至完成后空翻。但接下来更关键的问题是：这些系统能否在部署之后持续地进行强化学习 —— 在真实世界的反馈中变得更稳定、更可靠，并在分布不断变化的新环境里持续适应与改进？

来自主题: AI技术研报

10610 点击 2026-02-08 11:56

小米给KV Cache减负80%！MiMo团队推出混合稀疏注意力架构

小米给KV Cache减负80%！MiMo团队推出混合稀疏注意力架构

小米给KV Cache减负80%！MiMo团队推出混合稀疏注意力架构

小米MiMo大模型团队，加入AI拜年战场——推出HySparse，一种面向Agent时代的混合稀疏注意力架构。

来自主题: AI技术研报

7703 点击 2026-02-08 11:53

ICLR 2026｜UIUC：一行代码彻底解决LLM推理的过度思考！

ICLR 2026｜UIUC：一行代码彻底解决LLM推理的过度思考！

ICLR 2026｜UIUC：一行代码彻底解决LLM推理的过度思考！

2025 年 1 月 20 日，DeepSeek 发布了推理大模型 DeepSeek-R1，在学术界和工业界引发了对大模型强化学习方法的广泛关注与研究热潮。研究者发现，在数学推理等具有明确答案的任务

来自主题: AI技术研报

6772 点击 2026-02-08 11:52

AgentDoG：为AI智能体戴上「诊断项圈」

AgentDoG：为AI智能体戴上「诊断项圈」

AgentDoG：为AI智能体戴上「诊断项圈」

随着 AI 智能体（Agent）能力日益强大，其自主行为带来的安全风险也愈发复杂。现有安全工具往往只能给出「安全 / 不安全」的简单判断，无法告知我们风险的根源。为此，上海人工智能实验室正式开源 Ag

来自主题: AI技术研报

8336 点击 2026-02-08 11:49

像挖币一样挖激活函数？DeepMind搭建「算力矿场」，暴力搜出下一代ReLU

像挖币一样挖激活函数？DeepMind搭建「算力矿场」，暴力搜出下一代ReLU

像挖币一样挖激活函数？DeepMind搭建「算力矿场」，暴力搜出下一代ReLU

一直以来，神经网络的激活函数就像是 AI 引擎中的火花塞。从早期的 Sigmoid、Tanh，到后来统治业界的 ReLU，再到近年来的 GELU 和 Swish，每一次激活函数的演进都伴随着模型性能的提升。但长期以来，寻找最佳激活函数往往依赖于人类直觉或有限的搜索空间。

来自主题: AI技术研报

6734 点击 2026-02-08 11:47

上一页当前第22页,共367页下一页