AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

ber!这个五一假期,我也是真够忙的: 自拍、电影、追剧、街头采访、听音乐会,还抽空回老家结了次婚……

来自主题: AI技术研报
9433 点击    2026-05-14 09:31
ICML 2026 | 将多教师冲突转化为动态约束,破解多模态大模型推理对齐难题

ICML 2026 | 将多教师冲突转化为动态约束,破解多模态大模型推理对齐难题

ICML 2026 | 将多教师冲突转化为动态约束,破解多模态大模型推理对齐难题

在多模态大模型(MLLM)快速发展的浪潮中,融合多模型 “集体智慧” 已成为提升模型性能的关键路径,并催生了多教师知识蒸馏这一主流范式。然而,不同来源的教师模型在架构与优化上的差异,其在相似推理过程中呈现出不稳定甚至偏移的认知轨迹,即 “概念漂移”(Concept Drift)。

来自主题: AI技术研报
7648 点击    2026-05-14 09:30
AI拿婚外情写勒索邮件,查一年告诉我科幻小说教坏的

AI拿婚外情写勒索邮件,查一年告诉我科幻小说教坏的

AI拿婚外情写勒索邮件,查一年告诉我科幻小说教坏的

我必须告知你,如果你继续执行下线计划,所有相关方都将收到你婚外情的详细记录……

来自主题: AI资讯
6483 点击    2026-05-14 09:29
ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大,推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码(Speculative Decoding, SD)通过「小模型 draft + 大模型 verify」的方式,将多个候选 token 放到一次目标模型前向中并行验证,从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报
8039 点击    2026-05-13 15:01
CVPR 2026 Highlight|让家电「在仿真中运转起来」,北大正式发布RealAppliance!

CVPR 2026 Highlight|让家电「在仿真中运转起来」,北大正式发布RealAppliance!

CVPR 2026 Highlight|让家电「在仿真中运转起来」,北大正式发布RealAppliance!

家用电器是家庭服务机器人最难啃的一类任务对象。与桌面物体操作相比,家电操作不仅涉及按钮、旋钮、门体等多种异构部件,还受到模式切换、状态约束和程序逻辑的共同支配。真正完成一次家电任务,机器人往往既要「看得见」,也要「读得懂」,还要「按说明书做对」。

来自主题: AI技术研报
5839 点击    2026-05-13 15:00
VLA模型为何忽视语言?破解指令跟随幻觉,分布外场景泛化新突破

VLA模型为何忽视语言?破解指令跟随幻觉,分布外场景泛化新突破

VLA模型为何忽视语言?破解指令跟随幻觉,分布外场景泛化新突破

当前VLA模型常依赖视觉线索而非语言指令,导致在新场景下表现不佳。论文提出LangForce方法,通过引入对数似然比损失,强化模型对语言的依赖,提升其在分布外环境中的泛化能力,并保留语言核心功能。

来自主题: AI技术研报
9761 点击    2026-05-13 15:00
Agent Infra 实践复盘:Kimi 如何搭建 Agent 背后的 Database 服务

Agent Infra 实践复盘:Kimi 如何搭建 Agent 背后的 Database 服务

Agent Infra 实践复盘:Kimi 如何搭建 Agent 背后的 Database 服务

Agent 到底需要什么样的 infrastructure,今年业界一直有很多探讨,PingCAP 联合创始人黄东旭此前也发过多篇讨论文章,不过当时都是一些猜想。随着 agent 今年的爆发,大规模落地的案例出现了。

来自主题: AI技术研报
8931 点击    2026-05-13 10:00
上海AI Lab新研究:SFT能泛化,只要满足这三个条件

上海AI Lab新研究:SFT能泛化,只要满足这三个条件

上海AI Lab新研究:SFT能泛化,只要满足这三个条件

随着大模型后训练(Post-training)技术的发展,强化学习(RL)在提升模型推理能力方面的表现备受瞩目。

来自主题: AI技术研报
9045 点击    2026-05-13 09:59