AI资讯新闻榜单内容搜索-AR

AI真的有意识了吗？《降临》原作万字长文反驳Hinton！

AI 是否有意识了？Anthropic 在 Claude 内部发现了能驱动作弊甚至勒索的「情绪向量」，三大实验室同时下注 AI 意识研究；Hinton 认为 AI 已经有意识了，而科幻作家姜峯楠随即在《大西洋月刊》发万字长文全面否定；哈萨比斯从行业内部划清界限。这个问题的答案，正在重新定义通往 AGI 的路线图。

来自主题: AI资讯

9566 点击 2026-06-08 09:50

AI真能学会心算？隐式思维链首次得到理论证明，Stuart Russell参与

过去一年，AI 推理模型的使用成本让不少开发者叫苦。

来自主题: AI技术研报

6947 点击 2026-06-08 09:49

37万次真实会话实测Agent榜单：GPT-5.5High第一，Claude最稳，真实干活能力看这五项核心指标

6月4日，Arena.ai发布Agent Arena排行榜，用373,431次真实会话的数据，给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”（Net Improvement），用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好，负值说明不如随机。

来自主题: AI技术研报

9160 点击 2026-06-07 14:38

DeepSeek V4做数学证明，500倍成本优势：智能体系统刷新多项纪录

近日，普林斯顿大学的研究团队发布了一篇新论文，提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型，是国内开源大模型 DeepSeek-V4-Flash。

来自主题: AI技术研报

8332 点击 2026-06-07 10:56

CVPR 2026｜LLM会写3D视觉代码吗？清华联合智源用GeoCodeBench给出答案

近日，来自清华大学智能产业研究院（AIR）的团队联合北京智源研究院（BAAI）、北京大学、南京大学等机构构建了一个基准：GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark，

来自主题: AI技术研报

9055 点击 2026-06-07 10:54

热门Harness项目OpenSquilla：拯救烧token烧到绝望的Agent们，估值1亿

OpenSquilla 是一个开源 Agent Harness 框架（https://github.com/opensquilla/opensquilla）。它在 Agent 应用和模型之间加了一层运行中枢。OpenSquilla 由上海基元律动科技有限公司开发。基元律动成立仅几个月后，已完成首轮融资，估值高达1亿美元。

来自主题: AI资讯

9351 点击 2026-06-06 10:34

活久见！奥特曼Dario哈萨比斯同仇敌忾：DNA得查了

刚刚，AI圈发生了一件很不寻常的事。Sam Altman、Dario Amodei、Demis Hassabis……一群平时打得最凶的人，把名字签在了同一封公开信上。他们联合呼吁美国国会：立法强制筛查所有合成DNA订单。

来自主题: AI资讯

7697 点击 2026-06-06 09:47

10个神操作，让Hermes全天候主动干活

有人的Hermes像个聊天窗口，你喊一声它回一句，有人已经把Hermes用成了24小时不睡觉的AI助手，你不用说话，它自己就知道该干什么。这个人叫Sharbel，是海外视频平台YouTube大神，开源了一些Agent相关的项目。他在最新视频里公开了10个把Hermes从对话工具变成可用助手的操作，只要token充足，你的Hermes就可以7×24小时永不停转。

来自主题: AI资讯

7852 点击 2026-06-05 15:32

超越TurboQuant：Together AI把2-bit KV Cache推向真实服务

长上下文模型越来越能“记”，但真正让它们跑到线上时，最先顶不住的往往不是算力，而是KV Cache。

来自主题: AI技术研报

5501 点击 2026-06-05 09:53

老黄的Cosmos 3刚发一天，就被一家中国公司反超了

6 月 1 日，老黄在 GTC 上用了不小的篇幅讲物理 AI 和具身智能，并重磅发布了 Cosmos 3。英伟达将其定义为面向 Physical AI 的最新前沿模型，也是全球首个完全开放的全能模型，原生具备视觉推理、世界生成和动作生成能力。

来自主题: AI资讯

8925 点击 2026-06-04 09:15