AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
成功率最高暴跌36.9%!南洋理工首个“模糊指令”测试,直击具身智能落地软肋

成功率最高暴跌36.9%!南洋理工首个“模糊指令”测试,直击具身智能落地软肋

成功率最高暴跌36.9%!南洋理工首个“模糊指令”测试,直击具身智能落地软肋

在语言学中,人类之所以能听懂“那个东西”、“它”、“这个重物”,依赖于桥接推理理论 (bridging inference),即通过上下文信息在已有记忆与当前表达之间建立联系,从而恢复指代对象。

来自主题: AI技术研报
6127 点击    2026-04-29 09:55
ICLR 2026 Oral | 没人诱导,大模型也会「骗人」

ICLR 2026 Oral | 没人诱导,大模型也会「骗人」

ICLR 2026 Oral | 没人诱导,大模型也会「骗人」

新加坡国立大学 Bingsheng He 教授团队一篇最新入选 ICLR 2026 Oral 的论文,把视角放在了一个更贴近日常使用场景的问题上:人们更熟悉的,是用户故意诱导模型说假话的情形;而这篇工作真正追问的是,在没有刻意诱导、只是正常提问的情况下,模型会不会也出现某种 “表面这样答,实际那样想” 的现象。

来自主题: AI技术研报
6508 点击    2026-04-29 09:48
LangFlow: 挑战离散扩散,探索下一代语言模型新范式

LangFlow: 挑战离散扩散,探索下一代语言模型新范式

LangFlow: 挑战离散扩散,探索下一代语言模型新范式

主要作者团队:Yuxin Chen 现为伊利诺伊大学厄巴纳 - 香槟分校(UIUC)硕士一年级学生,Chumeng Liang 为 UIUC 博士一年级学生,Hangke Sui 为 UIUC 博士二年级学生,Ge Liu 为 UIUC 计算机系助理教授。Liu Lab 团队长期聚焦扩散 / 流模型方向,

来自主题: AI技术研报
6779 点击    2026-04-29 09:36
ACL 2026 | LCA:DeepSeek 长文本加速神器,90% KV 缓存缩减 + 2.5 倍推理提速

ACL 2026 | LCA:DeepSeek 长文本加速神器,90% KV 缓存缩减 + 2.5 倍推理提速

ACL 2026 | LCA:DeepSeek 长文本加速神器,90% KV 缓存缩减 + 2.5 倍推理提速

近日,琶洲实验室、华南理工大学、蔻町(AIGCode)等单位科研团队联合提出潜在空间压缩注意力(Latent-Condensed Attention,LCA),研究成果入选 ACL 2026。

来自主题: AI技术研报
8026 点击    2026-04-29 09:35
流式意图检测+永久记忆,NUS&NTU发布Pask:把贾维斯AI拉进现实

流式意图检测+永久记忆,NUS&NTU发布Pask:把贾维斯AI拉进现实

流式意图检测+永久记忆,NUS&NTU发布Pask:把贾维斯AI拉进现实

让AI像助手一样主动帮助,才是我们心中AGI的样子。主动智能体的概念已经被多次提出,但都很难做到可以真正在生活中落地。现有的工作都还停留在概念层面,无法解决复杂世界中所要求的实时性、深度、和记忆等问题。 南洋理工大学谢之非团队提出Pask,使用「底层小模型流式意图检测」+ 「上层Agents执行」架构,实现首个能够做到实时、有深度、基于个人全局记忆自进化的主动智能体。

来自主题: AI技术研报
7412 点击    2026-04-28 15:08
MiniCPM-o 4.5 技术报告发布:全双工全模态 API 开放,RTX5070即可实时运行

MiniCPM-o 4.5 技术报告发布:全双工全模态 API 开放,RTX5070即可实时运行

MiniCPM-o 4.5 技术报告发布:全双工全模态 API 开放,RTX5070即可实时运行

你有没有想过,不用联网、仅用一张消费级显卡,就能在个人电脑上拥有一个「边看、边听、边说、还能主动提醒」的类人 AI 助手?这就是 MiniCPM-o 4.5 所能做到的。在技术创新下,它仅凭 9B 参数,实现了业界首个端到端全双工全模态大模型,让端侧 AI 普惠成为现实。其自 2026 年 2 月模型发布以来,在 Hugging Face 上的下载量已突破 25 万+。

来自主题: AI技术研报
6711 点击    2026-04-28 13:15
超越DeepSeek-V4!罗福莉交出小米最强开源模型MiMo-V2.5-Pro,首日适配5家国产芯片

超越DeepSeek-V4!罗福莉交出小米最强开源模型MiMo-V2.5-Pro,首日适配5家国产芯片

超越DeepSeek-V4!罗福莉交出小米最强开源模型MiMo-V2.5-Pro,首日适配5家国产芯片

刚刚,小米开源罗福莉带队研发的MiMo-V2.5系列模型,采用MIT协议,允许商用推理部署与二次训练,无需额外授权。此前,该系列模型于4月23日开启公测,包括MiMo-V2.5-Pro、MiMo-V2.5两款模型。模型具备更强Agent能力,支持100万上下文,且Token效率大幅提升。

来自主题: AI资讯
8170 点击    2026-04-28 10:13
不换GPU,性能飙升2.8倍!英伟达用软件暴打摩尔定律

不换GPU,性能飙升2.8倍!英伟达用软件暴打摩尔定律

不换GPU,性能飙升2.8倍!英伟达用软件暴打摩尔定律

MoE模型的稀疏激活本是优势,却常陷通信瓶颈。NVIDIA以软件为利剑,通过程序化依赖启动和全对全通信革新,在三个月内将GB200的单GPU吞吐提升2.8倍,真正释放Blackwell硬件潜力。

来自主题: AI技术研报
8972 点击    2026-04-28 10:09
AI「看不懂」、「做不好」视频的问题,混元用「MTSS」解决了

AI「看不懂」、「做不好」视频的问题,混元用「MTSS」解决了

AI「看不懂」、「做不好」视频的问题,混元用「MTSS」解决了

腾讯混元团队提出了 Multi-Stream Scene Script(MTSS),一种全新的视频描述范式 —— 将传统的 "一段话描述整个视频" 升级为 "多流结构化剧本",通过 Stream Factorization 和 Relational Grounding 两大核心原则,让视频描述既忠实又可扩展,在视频理解和生成任务中均取得显著提升。

来自主题: AI技术研报
6432 点击    2026-04-28 09:57
超越Claude Mythos和GPT-5.5!斯坦福Agent验证框架拿下SOTA,Transformer作者转发

超越Claude Mythos和GPT-5.5!斯坦福Agent验证框架拿下SOTA,Transformer作者转发

超越Claude Mythos和GPT-5.5!斯坦福Agent验证框架拿下SOTA,Transformer作者转发

Transformer论文作者Lukasz Kaiser以及GAN作者Bing Xu转发关注了一项工作——LLM-as-a-Verifier验证框架,该方法是一种通用的验证机制,可与任意Agent Harness和模型结合。

来自主题: AI技术研报
8200 点击    2026-04-27 15:18