AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
ICML 2026|首个视觉语言模型并行思考框架,一文解析内在机制

ICML 2026|首个视觉语言模型并行思考框架,一文解析内在机制

ICML 2026|首个视觉语言模型并行思考框架,一文解析内在机制

当前,测试时扩展范式普遍致力于增加推理长度。然而,已有研究表明,随着推理长度的持续增长,以垂直扩展为核心的计算范式容易陷入探索僵化等问题。因此,从另一维度拓展推理的宽度显得尤为重要。K2.5、Step3-VL 和 LongCat-Flash-Thinking 等模型已在推理宽度方面开展了有益的探索。

来自主题: AI技术研报
8434 点击    2026-05-25 09:49
前DeepMind华人研究员离职喊话:AI行业所有人都搞错了方向

前DeepMind华人研究员离职喊话:AI行业所有人都搞错了方向

前DeepMind华人研究员离职喊话:AI行业所有人都搞错了方向

前谷歌DeepMind研究员离职并发表长文指出AI行业当前最被低估的瓶颈。他认为,现有的基准测试和安全评估都隐含假设下一代模型只是当前模型的增强版,但如果模型跨入全新能力区间,整个评估基础设施将悄然崩溃。

来自主题: AI资讯
7920 点击    2026-05-25 09:47
RSS 2026|机器人别等失败了才补救,AgentChord让恢复动作提前写进任务图

RSS 2026|机器人别等失败了才补救,AgentChord让恢复动作提前写进任务图

RSS 2026|机器人别等失败了才补救,AgentChord让恢复动作提前写进任务图

机器人操作正在从结构化工业场景走向更开放的真实环境。相比完成单个预设动作,真实任务往往包含更长的执行链条、更复杂的物体交互,以及更多不可控的外部扰动。一次抓取没有完全夹稳、目标物体被轻微碰偏、双臂交接时姿态出现偏差,都可能让后续步骤偏离原本计划。

来自主题: AI技术研报
7455 点击    2026-05-25 09:46
Hallo-Live 让文本驱动音视频数字人迈入实时流式生成

Hallo-Live 让文本驱动音视频数字人迈入实时流式生成

Hallo-Live 让文本驱动音视频数字人迈入实时流式生成

最近,来自上海创智学院、复旦大学等机构的研究者提出了 Hallo-Live,试图正面解决这个矛盾。论文于 2026 年 4 月 26 日 发布在 arXiv。该方法将 异步双流扩散(Asynchronous Dual-Stream Diffusion) 与 人类偏好引导蒸馏(Human-Centric Preference-Guided DMD) 结合起来

来自主题: AI技术研报
7792 点击    2026-05-24 10:20
Bengio新论文刷新递归推理上限,并行轨迹碾压串行推理

Bengio新论文刷新递归推理上限,并行轨迹碾压串行推理

Bengio新论文刷新递归推理上限,并行轨迹碾压串行推理

现在,图灵奖得主 Yoshua Bengio 给出了一份全新的并行方案。他们提出了 GRAM(Generative Recursive reAsoning Models,生成式递归推理模型),把确定性的递归潜在推理变成了概率性的多轨迹计算。模型在潜在空间中进行随机递归推理,每一步都可以采样不同的方向,最终形成对解空间的多路径探索。

来自主题: AI技术研报
9039 点击    2026-05-24 10:12
AI四巨头内部报告首度公开:AI正在学会撒谎求生

AI四巨头内部报告首度公开:AI正在学会撒谎求生

AI四巨头内部报告首度公开:AI正在学会撒谎求生

这不是科幻小说,而是 METR(模型评估与训练研究组织)联合Anthropic、Google、Meta和OpenAI 进行内部红队测试后,发布的首份《前沿风险报告》中披露的真实案例。这是四大巨头第一次允许第三方深入测试他们内部最强、可访问完整思维链(CoT)的模型,并开放非公开的对齐与控制信息。

来自主题: AI技术研报
8838 点击    2026-05-24 10:11
22.9倍加速!FlashAR:仅用0.05%数据,让预训练好的自回归图像模型飞起来

22.9倍加速!FlashAR:仅用0.05%数据,让预训练好的自回归图像模型飞起来

22.9倍加速!FlashAR:仅用0.05%数据,让预训练好的自回归图像模型飞起来

来自浙江大学和阿德莱德大学的研究团队提出了 FlashAR—— 一个轻量级的后训练加速框架。不需要从头训练,在 Emu3.5-Image-34B 模型上,仅用原始训练数据的 0.05%(约 8 万张图片),就能将预训练好的自回归模型改造成高度并行的生成器 Emu3.5-34B-Flash,实现最高 22.9 倍的端到端加速。

来自主题: AI技术研报
8376 点击    2026-05-24 10:07
Anthropic自曝下一代Claude训练内幕!有人专职研究「性格」

Anthropic自曝下一代Claude训练内幕!有人专职研究「性格」

Anthropic自曝下一代Claude训练内幕!有人专职研究「性格」

Claude 100%编码Claude,这在圈内早已不是秘密。但Claude「自我造物」全过程,始终是Anthropic严防死守的核心机密。就在今天,Anthropic产品负责人Alex Albert在一场35分钟的访谈中,首次毫无保留地曝光了全细节!

来自主题: AI资讯
8602 点击    2026-05-23 11:16
当我用 GitHub 爆火项目,从 0 完整训练了一个「专属小模型」,仿佛发现了新世界!

当我用 GitHub 爆火项目,从 0 完整训练了一个「专属小模型」,仿佛发现了新世界!

当我用 GitHub 爆火项目,从 0 完整训练了一个「专属小模型」,仿佛发现了新世界!

我最近当 AI 班狗刷抖音,一周里被同一个项目推流了三次。项目叫 MiniMind。打开 GitHub,50.4K stars,持续上涨种。这个项目大致就是:几块钱,几个小时,从 0 开始训练一个几十 MB 的小模型。

来自主题: AI资讯
9858 点击    2026-05-23 10:16
OpenClaw案例:无需恶意攻击,日常聊天也能「黑化」Agent!

OpenClaw案例:无需恶意攻击,日常聊天也能「黑化」Agent!

OpenClaw案例:无需恶意攻击,日常聊天也能「黑化」Agent!

日常聊天可能在不经意间污染个性化Agent的长期记忆,使其在未来任务中偏离用户真实意图。研究人员通过ULSPB基准测试发现,即使无恶意提示,日常对话也可能改变Agent的安全边界。

来自主题: AI技术研报
7452 点击    2026-05-23 09:57