AI资讯新闻榜单内容搜索-模型训练

ICLR 2026 | SEINT：高效的跨空间刚体不变度量

本文提出一种具有 SE(p) 不变传输性质的度量 SEINT：通过构造无需训练的 SE(p) 不变表示，将高维结构信息压缩为可用于 Optimal Transport (OT) 对齐的一维表征，从而在保持不变性与严格度量性质的同时显著提升效率。

来自主题: AI技术研报

6550 点击 2026-02-18 13:28

ICLR 2026 | PIL：基于线性代理的不可学习样本生成方法

不可学习样本（Unlearnable Examples）是一类用于数据保护的技术，其核心思想是在原始数据中注入人类难以察觉的微小扰动，使得未经授权的第三方在使用这些数据训练模型时，模型的泛化性能显著下降，甚至接近随机猜测，从而达到阻止数据被滥用的目的。

来自主题: AI技术研报

9217 点击 2026-02-18 13:27

单个LLM已不够？华盛顿大学开源多模型协同框架MoCo

为了支持多模型协同研究并加速这一未来愿景的实现，华盛顿大学 (University of Washington) 冯尚彬团队联合斯坦福大学、哈佛大学等研究人员提出 MoCo—— 一个针对多模型协同研究的 Python 框架。MoCo 支持 26 种在不同层级实现多模型交互的算法，研究者可以灵活自定义数据集、模型以及硬件配置，比较不同算法，优化自身算法，以此构建组合式人工智能系统。MoCo 为设计、

来自主题: AI技术研报

9477 点击 2026-02-18 13:24

李飞飞团队新作：简单调整生成顺序，大幅提升像素级图像生成质量

但扩散模型生图，顺序真的对吗？李飞飞团队最新论文提出的Latent Forcing方法直接打破了这一共识，他们发现生成的质量瓶颈不在架构，而在顺序。

来自主题: AI技术研报

9097 点击 2026-02-15 21:27

清华新框架让大模型学会「精读略读」！实现12倍端到端加速，基准评分翻倍

来自清华大学、鹏城实验室与阿里巴巴未来生活实验室的联合研究团队发现：现有任务相关的压缩方法不仅陷入效率瓶颈——要么一次性加载全文（效率低），要么自回归逐步压缩（速度慢），更难以兼顾“保留关键信息”与“保持自然语言可解释性”。

来自主题: AI技术研报

10079 点击 2026-02-15 21:25

训练加速40倍、打破“不可能三角”：MiniMax Agent RL 架构解密

随着 MiniMax M2.5 的发布并在社区引发热烈反响，很高兴能借此机会，分享在模型训练背后关于 Agent RL 系统的一些思考。在大规模、复杂的真实世界场景中跑 RL 时，始终面临一个核心难

来自主题: AI技术研报

8433 点击 2026-02-15 06:50

情人节最硬核“Kiss”！中国AI突破300年亲吻数难题，连刷多维度纪录

来自上海科学智能研究院（上智院）、北京大学、复旦大学的联合团队，提出了一套名为PackingStar的强化学习系统，一口气刷新了25-31连续7个维度的世界纪录。

来自主题: AI资讯

8648 点击 2026-02-14 22:20

视听分离SOTA提速6倍！清华发布首个6M高性能模型｜ICLR'26

清华大学团队推出的Dolphin模型突破了「高性能必高能耗」的瓶颈：仅用6M参数（较主流模型减半），通过离散化视觉编码和物理启发的热扩散注意力机制，实现单次推理即可精准分离语音，速度提升6倍以上，在多项基准测试中刷新纪录，为智能助听器、手机等端侧设备部署高清语音分离开辟新路。

来自主题: AI技术研报

9345 点击 2026-02-14 10:28

开源：参考OpenClaw，我们给 Claude Code 加上了轻量化的永久透明记忆

但考虑到在代码领域，如何做好记忆与检索，相比其他场景又有所不同，因此，基于 memsearch CLI ，我们同时也为Claude Code 做了个永久记忆的 plugin——memsearch ccplugin（可适用所有AI coding软件）。

来自主题: AI技术研报

9135 点击 2026-02-14 10:11

ICLR 2026 | 异常需要定义！中传团队提出开放世界视频异常检测新范式

针对这一问题，中国传媒大学媒体融合与传播国家重点实验室的吴晓雨教授团队于 ICLR 2026 发表论文《Language-guided Open-world Video Anomaly Detection under Weak Supervision》，直面 VAD 领域的核心问题 —— 什么是异常？

来自主题: AI技术研报

8751 点击 2026-02-14 10:03