AI资讯新闻榜单内容搜索-模型

花了1000倍的token，效果可能却没有更好：AI Agent的“隐性账单”长什么样

如今的 AI Agent 正在大规模落地，其中应用最广且最受关注的当数 Claude Code，Codex，Cursor 这类 coding agent。过去的一年里，这类 coding agent 产品迭代迅速，在一年内将在 swe-bench- verified 的准确率提高到了 78%+。

来自主题: AI技术研报

6890 点击 2026-05-19 10:00

9.9元起！三大运营商杀入Token生意，以后用AI就像交话费？

最近几天，中国电信、中国移动、中国联通接连推出Token套餐及相关AI服务，面向个人、家庭、开发者、中小微企业等用户销售大模型调用量。这是三大运营商首次正式入局Token生意，而此前相关业务由大模型厂商、互联网大厂和云服务商主导。

来自主题: AI资讯

8780 点击 2026-05-18 21:38

吴恩达、Karpathy 天使轮，微软、SpaceX抢购，Inception到底什么来头？

扩散模型杀进了文本生成的地盘，而巨头们为了抢它，已经打起来了。

来自主题: AI资讯

7624 点击 2026-05-18 17:54

「世界模型」究竟是什么？一文看懂其前世今生与百亿赌局

世界模型（World Model），想必你已经在很多场合听过这个术语了。它有时出现在视频生成领域，有时又出现在具身智能领域；它们的含义还有所差别，甚至看起来像是完全不同的概念。

来自主题: AI技术研报

6559 点击 2026-05-18 16:48

CVPR 2026 Oral | 清华+阿里发布ViT³：解锁「视觉TTT」新架构，突破Transformer复杂度瓶颈

序列建模是大语言模型、计算机视觉等领域的基础共性问题。当前通用的 Transformer 模型计算复杂度随序列长度平方增长，在长序列任务中面临显著的计算挑战。因此，研究者们一直在探索具有线性计算复杂度的高效序列建模方法。

来自主题: AI技术研报

5820 点击 2026-05-18 15:30

LLM助力突破尘封60年数学猜想！北大王立威团队大幅刷新斯坦纳比下界

近期，LLM 已经在 IMO 上取得了很好的成绩，在一些研究级数学上（如短程证明、组合构造）也有所进展。但如果真正让 LLM 去处理提出数十年的数学猜想，结果会是如何？

来自主题: AI技术研报

5548 点击 2026-05-18 15:29

信通院&清华提出FedRE：用「纠缠」搞定联邦学习三难困境 | CVPR 26

在联邦学习中，如何同时兼顾模型性能、数据隐私和通信开销，是一个亟需解决的挑战。

来自主题: AI技术研报

10063 点击 2026-05-18 15:29

ICML 2026 | 华为GTS提出AI训练数据新方法，Amazon/Google作者团队「光速跟进」：难度自适应训练正在成为新范式

在大模型后训练中，数据不再只是 “越多越好”，而是要像人类学习一样，动态选择最合适难度的样本。华为提出的 EDCO 方法，将样本难度估计与动态课程编排引入领域大模型微调；数月后，由 Rutgers、Amazon、Google 等作者参与的 DARE 论文即引用 EDCO，并将其作为难度感知强化学习训练的重要对比基线。

来自主题: AI技术研报

5602 点击 2026-05-18 15:29

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

DAG框架利用时间与通道双重相关网络，有效整合历史与未来外生变量信息，提升时间序列预测准确性。通过发现并注入相关关系，充分利用未来协变量，显著优于现有方法。

来自主题: AI技术研报

6963 点击 2026-05-18 15:28

ICML 2026 ｜让大模型边想边说：这篇文章把「何时开口」变成可学习策略

用过推理型大模型的人，大概率都熟悉这种体验：模型似乎在认真思考，但屏幕上长时间没有真正有用的内容；如果让它一开始就输出，又很容易出现仓促判断，后面的推理还要被早期错误牵着走。

来自主题: AI技术研报

9812 点击 2026-05-18 15:27