AI资讯新闻榜单内容搜索-Claude

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Claude
37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

6月4日,Arena.ai发布Agent Arena排行榜,用373,431次真实会话的数据,给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”(Net Improvement),用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好,负值说明不如随机。

来自主题: AI技术研报
9082 点击    2026-06-07 14:38
Codex撞脸Claude Code,新功能只领先11天

Codex撞脸Claude Code,新功能只领先11天

Codex撞脸Claude Code,新功能只领先11天

Codex和Claude Code长得越来越像了!最近,开发者Elie Bakouch感到Claude Code和Codex的功能越来越像,他好奇到底哪家在领跑,于是就把两家都有的功能做成了一张时间线。

来自主题: AI资讯
8885 点击    2026-06-07 10:54
突发!Claude大面积宕机,用户竟收到「别人的对话」

突发!Claude大面积宕机,用户竟收到「别人的对话」

突发!Claude大面积宕机,用户竟收到「别人的对话」

就在昨天,Anthropic 的官方状态页突然挂起一排刺眼的红灯——Claude API、Claude Code、Claude.ai、Claude Cowork……几乎所有核心服务,突然大面积宕机。从 Opus 4.6 到 Opus 4.8,五大模型无一幸免。

来自主题: AI资讯
8900 点击    2026-06-06 21:17
终于看到一个跳出现有框架的AI产品了。

终于看到一个跳出现有框架的AI产品了。

终于看到一个跳出现有框架的AI产品了。

终于看到一个跳出 Codex、Claude Code 这些 Agent 范畴的新 AI 产品。而且在海外已经火起来了。这个产品叫 Aippy。目前 MAU 将近两百万,全球下载超过三百万,刚完成首轮融资,投后估值 2.5 亿美元。也是垂类赛道的新独角兽了。

来自主题: AI资讯
8397 点击    2026-06-06 09:48
Anthropic内部95%业务分析交给Claude,秘诀竟然不在更强模型

Anthropic内部95%业务分析交给Claude,秘诀竟然不在更强模型

Anthropic内部95%业务分析交给Claude,秘诀竟然不在更强模型

都以为让AI查数据省事,结果它答得漂亮你却不敢信。Anthropic最近说这事有解了,靠的是一套和代码无关的「笨功夫」。

来自主题: AI技术研报
6219 点击    2026-06-04 16:39
Claude Cowork做不好的领域,被国产黑马Agent彻底跑通了!

Claude Cowork做不好的领域,被国产黑马Agent彻底跑通了!

Claude Cowork做不好的领域,被国产黑马Agent彻底跑通了!

Cowork 在 Claude 带火后,大厂都在做,企业也早在用。但通用就是通用,碰上房地产这种数据非标、容错为零的硬骨头,全部露怯。跑通这块的,反而是一匹国产黑马。

来自主题: AI资讯
8058 点击    2026-06-03 15:26
忍无可忍,Linux之父怒怼AI:别再用「智能垃圾」塞满内核列表了!

忍无可忍,Linux之父怒怼AI:别再用「智能垃圾」塞满内核列表了!

忍无可忍,Linux之父怒怼AI:别再用「智能垃圾」塞满内核列表了!

今年4-5月,AI信息安全迎来「水门事件级」窗口:攻方落地、守方应急、噪音失控、治理失灵同时暴发。Anthropic主动封印Claude Mythos,只因它强大到必须送进末日火山。

来自主题: AI资讯
7119 点击    2026-06-03 14:32
什么是AI硬件的最佳形态?|《原点 Talk》Vol.6

什么是AI硬件的最佳形态?|《原点 Talk》Vol.6

什么是AI硬件的最佳形态?|《原点 Talk》Vol.6

过去三年来,所有人都在卷模型,参数更大、推理更深、上下文更长。但当Claude Code把Anthropic推到杀手级应用的位置、当OpenAI的Codex已经能替你写完一整本游记,问题终于绕了回来: 这些越来越像「人」的模型,到底要装进什么样的载体里,才算真正走进生活?

来自主题: AI资讯
6576 点击    2026-06-03 09:28