AI资讯新闻榜单内容搜索-模型

时空压缩！剑桥大学提出注意力机制MTLA：推理加速5倍，显存减至1/8

在大语言模型蓬勃发展的背景下，Transformer 架构依然是不可替代的核心组件。尽管其自注意力机制存在计算复杂度为二次方的问题，成为众多研究试图突破的重点

来自主题: AI技术研报

9361 点击 2025-06-11 11:43

1000 亿天价，扎克伯格买下「半个天才」和 Meta AI 的未来

不仅是大模型本身，Meta 也要成为 AI 基建大厂。

来自主题: AI资讯

6206 点击 2025-06-11 11:42

不是视频模型“学习”慢，而是LLM走捷径｜18万引大牛Sergey Levine

为什么语言模型能从预测下一个词中学到很多，而视频模型却从预测下一帧中学到很少？

来自主题: AI资讯

7617 点击 2025-06-11 11:37

o3-pro正式推出！说声“嗨”就花了80美元，思考1+1用时16分钟

OpenAI深夜放大招，正式推出“最新最强版”推理模型o3-pro！而且同一时间，o3模型降价80%不降智。官方测评结果显示，在专家评估中，所有人一致更偏爱o3-pro而非o3的回答。

来自主题: AI资讯

10920 点击 2025-06-11 10:50

苹果 AI「百亿补贴」来了：免费开放端侧模型，不跟 OpenAI 卷

今年苹果在 AI 上宣布的诸多所谓新功能，例如实时翻译、快捷指令等，并无太多革命性；至于视觉智能 (visual intelligence)，不仅功能落后 Google Lens 六七年，交互体验上也远未达到一众 Android 友商的内置 AI/Agent 产品在 2025 上半年水平。

来自主题: AI资讯

9856 点击 2025-06-10 19:17

华为创造AI算力新纪录：万卡集群训练98%可用度，秒级恢复、分钟诊断

大模型的落地能力，核心在于性能的稳定输出，而性能稳定的底层支撑，是强大的算力集群。其中，构建万卡级算力集群，已成为全球公认的顶尖技术挑战。

来自主题: AI技术研报

10561 点击 2025-06-10 17:05

一块4090搞定实时视频生成！Adobe黑科技来了

游戏直播等实时渲染门槛要被击穿了？Adobe 的一项新研究带来新的可能。

来自主题: AI技术研报

7941 点击 2025-06-10 16:52

大模型是「躲在洞穴里」观察世界？强化学习大佬「吹哨」提醒LLM致命缺点

为什么语言模型很成功，视频模型还是那么弱？

来自主题: AI资讯

8725 点击 2025-06-10 16:37

北大伯克利联手“拷问”大模型：最强Agent也才40分！新基准专治“不听话”的AI分析师

给大模型当老师，让它一步步按你的想法做数据分析，有多难？

来自主题: AI技术研报

8856 点击 2025-06-10 16:25

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

测试时扩展（Test-Time Scaling）极大提升了大语言模型的性能，涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么，什么是视觉领域的 test-time scaling？又该如何定义？

来自主题: AI技术研报

8776 点击 2025-06-10 16:18

AI资讯新闻榜单内容搜索-模型

时空压缩！剑桥大学提出注意力机制MTLA：推理加速5倍，显存减至1/8

1000 亿天价，扎克伯格买下「半个天才」和 Meta AI 的未来

不是视频模型“学习”慢，而是LLM走捷径｜18万引大牛Sergey Levine

o3-pro正式推出！说声“嗨”就花了80美元，思考1+1用时16分钟

苹果 AI「百亿补贴」来了：免费开放端侧模型，不跟 OpenAI 卷

华为创造AI算力新纪录：万卡集群训练98%可用度，秒级恢复、分钟诊断

一块4090搞定实时视频生成！Adobe黑科技来了

大模型是「躲在洞穴里」观察世界？ 强化学习大佬「吹哨」提醒LLM致命缺点

北大伯克利联手“拷问”大模型：最强Agent也才40分！新基准专治“不听话”的AI分析师

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

大模型是「躲在洞穴里」观察世界？强化学习大佬「吹哨」提醒LLM致命缺点