AI资讯新闻榜单内容搜索-AR

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AR
AI真的有意识了吗?《降临》原作万字长文反驳Hinton!

AI真的有意识了吗?《降临》原作万字长文反驳Hinton!

AI真的有意识了吗?《降临》原作万字长文反驳Hinton!

AI 是否有意识了?Anthropic 在 Claude 内部发现了能驱动作弊甚至勒索的「情绪向量」,三大实验室同时下注 AI 意识研究;Hinton 认为 AI 已经有意识了,而科幻作家姜峯楠随即在《大西洋月刊》发万字长文全面否定;哈萨比斯从行业内部划清界限。这个问题的答案,正在重新定义通往 AGI 的路线图。

来自主题: AI资讯
9566 点击    2026-06-08 09:50
37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

6月4日,Arena.ai发布Agent Arena排行榜,用373,431次真实会话的数据,给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”(Net Improvement),用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好,负值说明不如随机。

来自主题: AI技术研报
9160 点击    2026-06-07 14:38
DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

近日,普林斯顿大学的研究团队发布了一篇新论文,提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型,是国内开源大模型 DeepSeek-V4-Flash。

来自主题: AI技术研报
8332 点击    2026-06-07 10:56
CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

近日,来自清华大学智能产业研究院(AIR)的团队联合北京智源研究院(BAAI)、北京大学、南京大学等机构构建了一个基准:GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark,

来自主题: AI技术研报
9055 点击    2026-06-07 10:54
热门Harness项目OpenSquilla:拯救烧token烧到绝望的Agent们,估值1亿

热门Harness项目OpenSquilla:拯救烧token烧到绝望的Agent们,估值1亿

热门Harness项目OpenSquilla:拯救烧token烧到绝望的Agent们,估值1亿

OpenSquilla 是一个开源 Agent Harness 框架(https://github.com/opensquilla/opensquilla)。它在 Agent 应用和模型之间加了一层运行中枢。OpenSquilla 由上海基元律动科技有限公司开发。基元律动成立仅几个月后,已完成首轮融资,估值高达1亿美元。

来自主题: AI资讯
9351 点击    2026-06-06 10:34
活久见!奥特曼Dario哈萨比斯同仇敌忾:DNA得查了

活久见!奥特曼Dario哈萨比斯同仇敌忾:DNA得查了

活久见!奥特曼Dario哈萨比斯同仇敌忾:DNA得查了

刚刚,AI圈发生了一件很不寻常的事。Sam Altman、Dario Amodei、Demis Hassabis……一群平时打得最凶的人,把名字签在了同一封公开信上。他们联合呼吁美国国会:立法强制筛查所有合成DNA订单。

来自主题: AI资讯
7697 点击    2026-06-06 09:47
10个神操作,让Hermes全天候主动干活

10个神操作,让Hermes全天候主动干活

10个神操作,让Hermes全天候主动干活

有人的Hermes像个聊天窗口,你喊一声它回一句,有人已经把Hermes用成了24小时不睡觉的AI助手,你不用说话,它自己就知道该干什么。这个人叫Sharbel,是海外视频平台YouTube大神,开源了一些Agent相关的项目。他在最新视频里公开了10个把Hermes从对话工具变成可用助手的操作,只要token充足,你的Hermes就可以7×24小时永不停转。

来自主题: AI资讯
7852 点击    2026-06-05 15:32
超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

长上下文模型越来越能“记”,但真正让它们跑到线上时,最先顶不住的往往不是算力,而是KV Cache。

来自主题: AI技术研报
5501 点击    2026-06-05 09:53
老黄的Cosmos 3刚发一天,就被一家中国公司反超了

老黄的Cosmos 3刚发一天,就被一家中国公司反超了

老黄的Cosmos 3刚发一天,就被一家中国公司反超了

6 月 1 日,老黄在 GTC 上用了不小的篇幅讲物理 AI 和具身智能,并重磅发布了 Cosmos 3。英伟达将其定义为面向 Physical AI 的最新前沿模型,也是全球首个完全开放的全能模型,原生具备视觉推理、世界生成和动作生成能力。

来自主题: AI资讯
8925 点击    2026-06-04 09:15