AI资讯新闻榜单内容搜索-模型训练

TPAMI 2026 | 北大彭宇新团队提出CPL++框架，实现视觉定位模型的「自知之明」和「自我纠错」

本文是北京大学彭宇新教授团队在视觉定位方向的最新研究成果，相关论文已被顶级国际期刊 IEEE TPAMI 接收。为视觉定位模型赋予「自知之明」能力 —— 通过自监督的关联校正与验证模块，在训练过程中动态识别、衰减并纠正错误的监督信号。大量实验证明，让模型学会「自我纠错」，是突破弱监督视觉定位瓶颈的有效途径。

来自主题: AI技术研报

7793 点击 2026-04-17 08:41

AI安全得查祖宗三代？Anthropic登Nature揭秘大模型潜意识传染

AI模型只看了一串纯数字序列，就能继承另一个模型的危险偏好，即使删掉敏感词没有用，合成数据时代最隐蔽的安全裂缝，被撕开了。

来自主题: AI技术研报

8758 点击 2026-04-17 08:40

脸谱心智陆弘远团队ACL 2026新作：别再给模型叠加「高级词」了！模型更爱听「大白话」

有这样一种 “模型玄学”：明明是同一个 Prompt，仅仅换一种说法，模型的回答可能就天差地别。

来自主题: AI技术研报

9459 点击 2026-04-17 08:39

MSRA首测AI从零建仓库：能写、能跑，但不一定对丨ACL'26

大模型写代码这件事，越来越像「既能写片段，又离真实工程差一截」。

来自主题: AI技术研报

6661 点击 2026-04-16 16:07

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

当强化学习后训练的大规模 rollout 已经被证明能够提升图像生成模型的偏好对齐能力，推理负担就成了制约训练速度的核心瓶颈。来自 NVIDIA、港大和 MIT 的团队提出的 Sol-RL，通过「FP4 先探索、BF16 再训练」的后训练框架，将达到等效 reward 水平的收敛速度最高提升到 4.64x，在训练速度与对齐效果之间给出了一条更具工程可行性的解法。

来自主题: AI技术研报

9133 点击 2026-04-16 16:07