AI资讯新闻榜单内容搜索-

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 
37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

6月4日,Arena.ai发布Agent Arena排行榜,用373,431次真实会话的数据,给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”(Net Improvement),用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好,负值说明不如随机。

来自主题: AI技术研报
8308 点击    2026-06-07 14:38
独家|从图灵奖得主研究院到大湾区具身前线,映界科技做机器人空间大脑,融资千万

独家|从图灵奖得主研究院到大湾区具身前线,映界科技做机器人空间大脑,融资千万

独家|从图灵奖得主研究院到大湾区具身前线,映界科技做机器人空间大脑,融资千万

当资本疯狂涌入人形机器人本体,一家成立1个月的公司选择往下走一层,做所有机器人共同依赖的感知基础设施。三位创始人全部来自图灵奖得主Yoshua Bengio创立的Mila研究院生态。他们判断,最终拉开机器人差距的不是本体,而是对物理世界的理解与记忆。

来自主题: AI资讯
8335 点击    2026-06-07 12:02
百元主机也能跑AI代理,树莓派被OpenClaw意外带飞

百元主机也能跑AI代理,树莓派被OpenClaw意外带飞

百元主机也能跑AI代理,树莓派被OpenClaw意外带飞

而在这场狂欢中,受益者远远不止苹果一家。当地时间 6 月 5 日,著名单板计算机生产商树莓派(Raspberry Pi)宣布上调利润指引,2026年上半年预计出货超 400 万台,盈利“大幅超出市场预期”。截至当地时间 6 月 5 日晚七点,股价最新已达 1,051 便士,相较 2 月份的历史最低点(254 便士)翻了四倍多,市值已接近 20 亿英镑。

来自主题: AI资讯
9236 点击    2026-06-07 11:21
突发!OpenAI芯片元老加入Anthropic

突发!OpenAI芯片元老加入Anthropic

突发!OpenAI芯片元老加入Anthropic

今日,OpenAI自研芯片“002号员工”Clive Chan在X平台发文宣布,自己已经离开OpenAI,并于本周正式加入Anthropic。在离职声明中,Clive Chan回顾了自己过去两年多在OpenAI的经历。他提到,自己是OpenAI硬件团队的第二位招聘员工,亲历了OpenAI自研芯片项目从早期组建到如今逐步推进的全过程。

来自主题: AI资讯
8464 点击    2026-06-07 11:11
对话奇点灵智:少儿 AI 硬件的下一代,不是 Chatbot,而是能自进化的实体智能体

对话奇点灵智:少儿 AI 硬件的下一代,不是 Chatbot,而是能自进化的实体智能体

对话奇点灵智:少儿 AI 硬件的下一代,不是 Chatbot,而是能自进化的实体智能体

奇点灵智做了一款支持 Vibe Coding 的儿童硬件。 产品叫多奇 AI 小外教机器人,面向 3-8 岁孩子。今年 1 月在京东首发,首发期间产品进入京东榜单 Top 2,目前全平台订单超过 2

来自主题: AI资讯
8510 点击    2026-06-07 11:07
DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

近日,普林斯顿大学的研究团队发布了一篇新论文,提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型,是国内开源大模型 DeepSeek-V4-Flash。

来自主题: AI技术研报
7807 点击    2026-06-07 10:56
黄仁勋押注Token经济:你用的软件正变成AI收费站

黄仁勋押注Token经济:你用的软件正变成AI收费站

黄仁勋押注Token经济:你用的软件正变成AI收费站

6月1日,在英伟达GTC舞台,黄仁勋聊AI工厂,聊智能体,反复念叨的也是这个Token:算力就是收入,算力就是利润。没有收入和利润,就是亏损。一座AI工厂这辈子能赚多少钱,看的就是它总共产出多少Token,也就是曲线下方的面积。一句话:谁能更快、更省电、更稳定地生产Token,谁就赚得多。

来自主题: AI资讯
7996 点击    2026-06-07 10:56
大晓机器人联合南洋理工打通Physical AI全链路!PhysX-Omni补齐物理AI基建

大晓机器人联合南洋理工打通Physical AI全链路!PhysX-Omni补齐物理AI基建

大晓机器人联合南洋理工打通Physical AI全链路!PhysX-Omni补齐物理AI基建

该论文第一作者为曹子昂,研究方向主要聚焦于 3D AIGC、Physical AI 与具身智能。论文主要合作者包括来自南洋理工大学的李海天、姚润茂、洪方舟、陈昭熹,以及大晓机器人的刘英豪和潘亮。通讯作者为南洋理工大学刘子纬教授。

来自主题: AI技术研报
7774 点击    2026-06-07 10:55
Codex撞脸Claude Code,新功能只领先11天

Codex撞脸Claude Code,新功能只领先11天

Codex撞脸Claude Code,新功能只领先11天

Codex和Claude Code长得越来越像了!最近,开发者Elie Bakouch感到Claude Code和Codex的功能越来越像,他好奇到底哪家在领跑,于是就把两家都有的功能做成了一张时间线。

来自主题: AI资讯
8186 点击    2026-06-07 10:54
CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

近日,来自清华大学智能产业研究院(AIR)的团队联合北京智源研究院(BAAI)、北京大学、南京大学等机构构建了一个基准:GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark,

来自主题: AI技术研报
8654 点击    2026-06-07 10:54