AI资讯新闻榜单内容搜索-训练

视频世界模型跑长序列不「崩」了！用光流约束+历史记忆+多步训练，让动态场景稳如磐石

视频世界模型跑久了容易“散架”——要么人不动了，要么场景崩了。

来自主题: AI技术研报

6579 点击 2026-04-17 09:12

深度：Hermes Engineering如何用agent记忆升级skill？为什么说它只是半成品

最近Hermes agent被讨论得沸沸扬扬的，今天，我们来深度拆解下它是怎么做Skills 闭环系统的。

来自主题: AI技术研报

10400 点击 2026-04-17 09:12

UPenn提出Graph of Skills：把海量Skill连成技能图｜CC可用、支持Minimax2.7

很多人以为，给Agent装上更多Skill，它就会变得更强。

来自主题: AI技术研报

9014 点击 2026-04-17 09:11

今年最火的开源Agent项目，如何思考Agent的自我进化？

Agent 的持续学习和自我进化是最近行业内的讨论热点。

来自主题: AI技术研报

9030 点击 2026-04-17 09:11

MSRA首测AI从零建仓库：能写、能跑，但不一定对丨ACL'26

大模型写代码这件事，越来越像「既能写片段，又离真实工程差一截」。

来自主题: AI技术研报

9884 点击 2026-04-17 08:41

TPAMI 2026 | 北大彭宇新团队提出CPL++框架，实现视觉定位模型的「自知之明」和「自我纠错」

本文是北京大学彭宇新教授团队在视觉定位方向的最新研究成果，相关论文已被顶级国际期刊 IEEE TPAMI 接收。为视觉定位模型赋予「自知之明」能力 —— 通过自监督的关联校正与验证模块，在训练过程中动态识别、衰减并纠正错误的监督信号。大量实验证明，让模型学会「自我纠错」，是突破弱监督视觉定位瓶颈的有效途径。

来自主题: AI技术研报

8337 点击 2026-04-17 08:41

AI安全得查祖宗三代？Anthropic登Nature揭秘大模型潜意识传染

AI模型只看了一串纯数字序列，就能继承另一个模型的危险偏好，即使删掉敏感词没有用，合成数据时代最隐蔽的安全裂缝，被撕开了。

来自主题: AI技术研报

9251 点击 2026-04-17 08:40

脸谱心智陆弘远团队ACL 2026新作：别再给模型叠加「高级词」了！模型更爱听「大白话」

有这样一种 “模型玄学”：明明是同一个 Prompt，仅仅换一种说法，模型的回答可能就天差地别。

来自主题: AI技术研报

9915 点击 2026-04-17 08:39

MSRA首测AI从零建仓库：能写、能跑，但不一定对丨ACL'26

大模型写代码这件事，越来越像「既能写片段，又离真实工程差一截」。

来自主题: AI技术研报

7007 点击 2026-04-16 16:07

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

当强化学习后训练的大规模 rollout 已经被证明能够提升图像生成模型的偏好对齐能力，推理负担就成了制约训练速度的核心瓶颈。来自 NVIDIA、港大和 MIT 的团队提出的 Sol-RL，通过「FP4 先探索、BF16 再训练」的后训练框架，将达到等效 reward 水平的收敛速度最高提升到 4.64x，在训练速度与对齐效果之间给出了一条更具工程可行性的解法。

来自主题: AI技术研报

9609 点击 2026-04-16 16:07

AI资讯新闻榜单内容搜索-训练

视频世界模型跑长序列不「崩」了！用光流约束+历史记忆+多步训练，让动态场景稳如磐石

深度：Hermes Engineering如何用agent记忆升级skill？为什么说它只是半成品

UPenn提出Graph of Skills：把海量Skill连成技能图 ｜CC可用、支持Minimax2.7

今年最火的开源Agent项目，如何思考Agent的自我进化？

MSRA首测AI从零建仓库：能写、能跑，但不一定对丨ACL'26

TPAMI 2026 | 北大彭宇新团队提出CPL++框架，实现视觉定位模型的「自知之明」和「自我纠错」

AI安全得查祖宗三代？Anthropic登Nature揭秘大模型潜意识传染

脸谱心智陆弘远团队ACL 2026新作：别再给模型叠加「高级词」了！模型更爱听「大白话」

MSRA首测AI从零建仓库：能写、能跑，但不一定对丨ACL'26

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

UPenn提出Graph of Skills：把海量Skill连成技能图｜CC可用、支持Minimax2.7