AI资讯新闻榜单内容搜索-模型训练

真·开外挂！MIT新研究：架构0改动，让大模型解锁千万级上下文

让大模型轻松处理比自身上下文窗口长两个数量级的超长文本！

来自主题: AI技术研报

6700 点击 2026-01-19 16:47

ICLR 2026 的 Rebuttal 结束了。当 OpenReview 上的喧嚣散去，我们发现，作者与审稿人之间漫长的拉锯战，最终往往只剩下一个核心分歧：「这个想法，以前真的没人做过吗？」

来自主题: AI技术研报

9514 点击 2026-01-19 16:45

当你在电商平台搜索“苹果”，系统会推荐“水果”还是“手机”？或者直接跳到某个品牌旗舰店？短短一个词，背后承载了完全不同的购买意图。而推荐是否精准，直接影响用户的搜索体验，也影响平台的转化效率。

来自主题: AI技术研报

11289 点击 2026-01-19 15:15

视觉模型用于工业“缺陷检测”等领域已经相对成熟，但当前普遍使用的传统模型在训练时对数据要求较高，需要大量的经过精细标注的数据才能训练出理想效果。

来自主题: AI技术研报

9372 点击 2026-01-19 15:13

近日，清华大学与星尘智能、港大、MIT 联合提出基于对比学习的隐空间动作预训练（Contrastive Latent Action Pretraining, CLAP）框架。这个框架能够将视频中提纯的运动空间与机器人的动作空间进行对齐，也就是说，机器人能够直接从视频中学习技能！

来自主题: AI技术研报

8470 点击 2026-01-19 15:13

3D模型的实例分割一直受限于稀缺的训练数据与高昂的标注成本，训练效果有待提升。

来自主题: AI技术研报

10433 点击 2026-01-19 08:55

视频世界模型领域又迎来了新的突破！

来自主题: AI技术研报

9382 点击 2026-01-19 08:55

北邮最新综述探讨了文生图扩散模型的可控生成技术，总结了在文本条件之外引入新条件信号的方法，从任务和方法两个层面梳理了可控生成技术。

来自主题: AI技术研报

9495 点击 2026-01-19 08:55

随着大模型步入规模化应用深水区，日益高昂的推理成本与延迟已成为掣肘产业落地的核心瓶颈。在 “降本增效” 的行业共识下，从量化、剪枝到模型蒸馏，各类压缩技术竞相涌现，但往往难以兼顾性能损耗与通用性。

来自主题: AI技术研报

11109 点击 2026-01-19 08:54

在家庭厨房自主使用洗碗机，在办公室边移动边擦拭白板——这些人类习以为常的场景，对人形机器人来说，却是需要调动全身关节协同运作才能完成的“高难度挑战”。

来自主题: AI技术研报

11077 点击 2026-01-19 08:53