AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
GUI Agent「记与学」双修,长程任务有了专属记忆增强型自进化框架

GUI Agent「记与学」双修,长程任务有了专属记忆增强型自进化框架

GUI Agent「记与学」双修,长程任务有了专属记忆增强型自进化框架

本文团队长期从事负责任的人工智能与人工智能赋能社会科学相关研究,围绕视觉生成大模型安全治理、智能体安全等方向开展系统性工作,相关成果发表于AAAI、ICML、TMM 等国际期刊与会议。

来自主题: AI技术研报
7483 点击    2026-06-02 11:23
罗福莉划重点,小米大模型降价99%的秘籍公开

罗福莉划重点,小米大模型降价99%的秘籍公开

罗福莉划重点,小米大模型降价99%的秘籍公开

紧跟DeepSeek价格战,小米掏出技术底牌!

来自主题: AI技术研报
6795 点击    2026-06-01 13:58
ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己「组网」

ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己「组网」

ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己「组网」

大语言模型正在成为人工智能系统的核心组件。从文本生成、数学推理到代码编写,单个大模型已经展现出强大的能力。

来自主题: AI技术研报
7949 点击    2026-06-01 09:26
Rubrics综述:Agent时代,如何定义一个「好答案」?

Rubrics综述:Agent时代,如何定义一个「好答案」?

Rubrics综述:Agent时代,如何定义一个「好答案」?

近年来,随着大模型从简单问答,走向深度研究、医疗咨询、多模态生成和长程 Agent 任务,一个基础问题变得越来越难回答:我们到底应该怎样判断模型输出的质量?

来自主题: AI技术研报
8627 点击    2026-06-01 09:24
打破Agent训练瓶颈!人大&至知研究院开源Claw Agent数据+训练+评测全链条

打破Agent训练瓶颈!人大&至知研究院开源Claw Agent数据+训练+评测全链条

打破Agent训练瓶颈!人大&至知研究院开源Claw Agent数据+训练+评测全链条

大模型从“回答问题”走向“完成任务”,正在面临以下瓶颈:面向Claw Agents的数据、训练和评测都比传统environment training更难。为了解决该问题,中国人民大学、至知研究院等最新提出ClawGym——

来自主题: AI技术研报
6592 点击    2026-05-31 11:42
AI权威清洗: 一张肉眼难辨的图片,就能让GPT-5.4、Claude Opus 4.6集体造谣

AI权威清洗: 一张肉眼难辨的图片,就能让GPT-5.4、Claude Opus 4.6集体造谣

AI权威清洗: 一张肉眼难辨的图片,就能让GPT-5.4、Claude Opus 4.6集体造谣

来自 ETH Zurich 的 Florian Tramèr 团队在最新论文中抛出了一个出乎意料的问题:如果 AI"看到" 的图,根本不是你肉眼看到的那张,会发生什么样的后果呢?他们把这种现象称作 AI 权威清洗(AI Authority Laundering)。

来自主题: AI技术研报
9059 点击    2026-05-31 11:27
终于,清华快手养出了通人性的AI!

终于,清华快手养出了通人性的AI!

终于,清华快手养出了通人性的AI!

清华大学经济管理学院的陈柯均博士生、张佳音教授、徐心教授与快手消费策略算法部合作探索完成了一项联合实验:从视频传递的价值观的角度,去理解观看视频后用户的行为和心理变化。

来自主题: AI技术研报
8369 点击    2026-05-31 11:15
登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

登顶HuggingFace日榜!英伟达清华团队γ-World:把世界模型从单机打到联机

5 月下旬,NVIDIA 联合清华大学、多伦多大学和 Vector Institute 发布 Gamma-World,共一第一为清华大学电子系博士刘芳甫,核心 Research 方向是世界模型和空间智能。

来自主题: AI技术研报
9189 点击    2026-05-30 11:26
被困在考场里的大模型

被困在考场里的大模型

被困在考场里的大模型

昨天,大名鼎鼎的 Claude 4.8 发布了。 科技圈照例是一片欢呼。 看官方放出来的一堆评测数据,依然是碾压级别的,尤其是说代码(Coding)能力有了史诗级的提升,简直像交了一份满分答卷。

来自主题: AI资讯
8491 点击    2026-05-30 10:50
DiffusionOPD:复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式,让学⽣模型同时学会构图、⽂字与美学

DiffusionOPD:复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式,让学⽣模型同时学会构图、⽂字与美学

DiffusionOPD:复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式,让学⽣模型同时学会构图、⽂字与美学

近期,来自复旦大学与阿里巴巴通义万相的研究团队对此提出了新的思考。他们认为,多任务强化学习不应被视为一个统一优化问题,而应该解耦为两个彼此独立的过程:单任务的在线策略探索 & 多任务能力整合。

来自主题: AI技术研报
8255 点击    2026-05-30 10:49