AI资讯新闻榜单内容搜索-训练

用好视觉Attention局部性，清华、字节提出Token Reorder，无损实现5倍稀疏、4比特量化

近年来，随着视觉生成模型的发展，视觉生成任务的输入序列长度逐渐增长（高分辨率生成，视频多帧生成，可达到 10K-100K）。

来自主题: AI技术研报

5805 点击 2025-06-30 15:35

尽管大型语言模型（LLMs）和大型视觉 - 语言模型（VLMs）在视频分析和长语境处理方面取得了显著进展，但它们在处理信息密集的数小时长视频时仍显示出局限性。

来自主题: AI技术研报

6054 点击 2025-06-30 14:34

What？LLM也要看出身！确实，不同的数据集训出的模型“个性”会有大不同，尤其在加之权衡方面。这就像我们经常与自己内心相互竞争的目标和价值观作斗争。

来自主题: AI资讯

5624 点击 2025-06-30 11:24

大模型的预训练-微调范式，正在悄然改写强化学习！伯克利团队提出新方法InFOM，不依赖奖励信号，也能在多个任务中实现超强迁移，还能做到「读心术」级别的推理。这到底怎么做到的？

来自主题: AI技术研报

5962 点击 2025-06-30 10:52

如今的视觉语言模型 (VLM, Vision Language Models) 已经在视觉问答、图像描述等多模态任务上取得了卓越的表现。然而，它们在长视频理解和检索等长上下文任务中仍表现不佳。

来自主题: AI技术研报

5952 点击 2025-06-30 10:24

让AI看懂95万物种，并自己悟出生态关系与个体差异!俄亥俄州立大学研究团队在2亿生物图像数据上训练了BioCLIP 2模型。大规模的训练让BioCLIP 2取得了目前最优的物种识别性能。

来自主题: AI技术研报

5432 点击 2025-06-29 16:59

今天，著名的人工智能学者和认知科学家 Gary Marcus 转推了 MIT、芝加哥大学、哈佛大学合著的一篇爆炸性论文，称「对于 LLM 及其所谓能理解和推理的神话来说，情况变得更糟了 —— 而且是糟糕得多。」

来自主题: AI技术研报

5426 点击 2025-06-29 16:11

扎克伯格又从奥特曼手里挖走4名顶尖AI人才，这次四位都是华人研究员。

来自主题: AI资讯

6523 点击 2025-06-29 13:54

最近，苹果的一篇论文掀起波澜，挑战了当下AI推理能力的基本假设。而OpenAI的前研究主管则断言：AGI时代已近在眼前。谁是谁非？AGI还有多远？

来自主题: AI技术研报

6894 点击 2025-06-29 12:30

这是我关于「AI Native 系列」的第二篇文章，主题是：行动闭环。在上一篇里，我讲了什么样的产品才算得上真正的 AI Native，分享了我对 MCP 协议、AI 架构原生性和任务闭环的理解。

来自主题: AI资讯

5995 点击 2025-06-29 11:45