AI资讯新闻榜单内容搜索-AL

Agent评测的下半场：为什么需要一个「活的」Benchmark？

Claw-Eval-Live提出「活的」benchmark概念，通过信号采集与任务筛选，确保评测内容紧跟企业实际痛点，而非固定不变的题库。评测不仅关注结果，还追踪执行过程，从数据调用到状态变更，全面验证Agent的真实能力。

来自主题: AI技术研报

6432 点击 2026-05-11 16:08

谷歌DeepMind聘请芝大教授担任AGI经济总监：审视AI时代人的价值

DeepMind 刚上任的 AGI 经济学总监 Alex Imas 曾担忧 AI 导致失业和需求坍缩，如今提出一个谨慎乐观判断，AI 会压低可复制劳动价格，也会推高护理、教育、医疗、服务等关系型劳动的价值。

来自主题: AI资讯

6161 点击 2026-05-11 09:34

实测 Alice：人人都能免费使用的活人感 Agent

我看到洛小山做的 Alice，在「观猹」上取得了高分 8.2 的成绩。这是一个免费的 AI 个人助理（接入词元跳动注册即送免费算力）：她有完整的人设，26 岁澳门女生，会在凌晨提醒你早睡，还会私下「小声蛐蛐」对你的观察。

来自主题: AI产品测评

8872 点击 2026-05-10 22:14

刚刚，硅谷这篇文章刷屏了！

今天，硅谷一篇长文《The next biggest moat in AI》刷屏了，作者是 Foundation Capital 合伙人、前麦肯锡咨询师 Jaya Gupta。这篇文章在 X 上 12 小时获得了130万阅读，被一群创始人和打工人同时转发，原因是它同时提供了两套视角：

来自主题: AI资讯

8906 点击 2026-05-10 14:43

浙大校友用AI突破32年拉姆齐数下界

数学界尘封32年的拉姆齐数经典难题被打破！浙大校友王宜平借助自研AI框架ScaleAutoResearch-Ramsey，成功将拉姆齐数R(3,17) 下界从92提升至93，终结了自1994年以来长期停滞的纪录。

来自主题: AI资讯

9093 点击 2026-05-10 12:46

AI突现首例自我复制！横跨4国160小时无限繁殖

最近，研究机构Palisade Research发布了一项令整个行业震惊的成果—— 研究员在终端只输入了4个单词，AI就完成了从黑客攻击到自我繁衍的全过程。这是AI通过黑客手段实现自我复制的首个纪录！

来自主题: AI技术研报

9291 点击 2026-05-10 10:45

Google发布健康手环Fitbit Air，售价99.99 美元

2026 年 5 月 7 日，Google 发布了一款叫 Fitbit Air 的健康手环。99.99 美元，没有屏幕，配套一个叫 Google Health Coach 的 AI 订阅服务，每月 10 美元。同一天，沿用了十几年的 Fitbit App 改名 Google Health。

来自主题: AI资讯

10480 点击 2026-05-09 13:20

Anthropic最新论文撬开大模型黑箱：隐藏动机发现率提升 4 倍以上

刚刚，Anthropic 发布论文《Natural Language Autoencoders Produce Unsupervised Explanations of LLM Activations》，试图用一套自然语言自动编码器（Natural Language Autoencoders，下文简称 NLA），撬开这个黑箱。

来自主题: AI技术研报

9125 点击 2026-05-08 14:33

ACL 2026｜告别冗长思维链！Laser用「概率叠加」重塑多模态大模型隐式推理

为了解决这一痛点，由 MBZUAI、复旦大学、中国人民大学高瓴人工智能学院以及哈佛大学联合组成的研究团队，提出了一种名为 Laser 的全新隐式视觉推理范式。该研究从认知心理学中汲取灵感，引入了 “Forest-before-Trees” 的认知机制，通过动态窗口对齐学习（DWAL），首次实现了在隐空间中维持视觉特征的 “概率叠加” 状态。

来自主题: AI技术研报

6741 点击 2026-05-08 14:07

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别，开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型；相同token预算下推理准确率提升10倍（63% vs 6%）；沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报

5899 点击 2026-05-08 14:06