AI资讯新闻榜单内容搜索-Claude

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Claude
GPT-5编程测评大反转!表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍

GPT-5编程测评大反转!表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍

GPT-5编程测评大反转!表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍

Scale AI的新软件工程基准SWE-BENCH PRO,出现反转!表面上看,“御三家”集体翻车,没一家的解决率超过25%: GPT-5、Claude Opus 4.1、Gemini 2.5分别以23.3%、22.7%、13.5%的解决率“荣”登前三。

来自主题: AI技术研报
8875 点击    2025-09-22 16:11
Claude 急了!模型降智,官方长文用 bug 搪塞?开发者怒怼“太晚了”:承认不达标为何不退钱?

Claude 急了!模型降智,官方长文用 bug 搪塞?开发者怒怼“太晚了”:承认不达标为何不退钱?

Claude 急了!模型降智,官方长文用 bug 搪塞?开发者怒怼“太晚了”:承认不达标为何不退钱?

“看得出 Anthropic 是真急了,都开始澄清了。”有网友在看到发文解释 8 月至 9 月初陆续出现 bug 的推文后表示。“产品质量这么差。我之前不明白为什么,现在明白了。”开发者 Tim McGuire 在帖子下表示。

来自主题: AI资讯
8035 点击    2025-09-22 08:43
7 小时连续重构不掉线!一骑绝尘的Claude 终于遇到对手:Greg Brockman亲自解读AI编程重大突破

7 小时连续重构不掉线!一骑绝尘的Claude 终于遇到对手:Greg Brockman亲自解读AI编程重大突破

7 小时连续重构不掉线!一骑绝尘的Claude 终于遇到对手:Greg Brockman亲自解读AI编程重大突破

9 月 16 日,OpenAI 正式推出一款新模型 GPT-5-Codex ,这是一个经过微调的 GPT-5 变体,专门为其各种 AI 辅助编程工具而设计。该公司表示,新模型 GPT-5-Codex 的“思考”时间比之前的模型更加动态,完成一项编码任务所需的时间从几秒到七个小时不等。因此,它在代理编码基准测试中表现更佳。

来自主题: AI技术研报
6561 点击    2025-09-18 15:19
最新实测GPT-5-Codex:前端能力碾压,复杂项目轻松搞定,Claude可以扔了!

最新实测GPT-5-Codex:前端能力碾压,复杂项目轻松搞定,Claude可以扔了!

最新实测GPT-5-Codex:前端能力碾压,复杂项目轻松搞定,Claude可以扔了!

昨天OpenAI正式发布了GPT-5-Codex,一个专门为Codex编码智能体研发的GPT-5版本。在看了全球网友实测效果后,基本结论就是可以告别Claude Code,放下Cursor,直接来拥抱Codex了!为了验证网友们的说法和GPT-5-Codex的真实能力,我们全面的测评了一下。

来自主题: AI产品测评
8116 点击    2025-09-17 19:27
7亿人每周狂发180亿条消息!OpenAI首次揭秘ChatGPT最火用途

7亿人每周狂发180亿条消息!OpenAI首次揭秘ChatGPT最火用途

7亿人每周狂发180亿条消息!OpenAI首次揭秘ChatGPT最火用途

ChatGPT首份使用报告重磅上线!周月活飙至7亿,它已成为高学历白领的办公利器,编程却成为冷门。同时,Anthropic最新报告称,人们交给Claude完成任务暴涨至49%。

来自主题: AI技术研报
6497 点击    2025-09-16 15:37
刚刚,Anthropic 公布了99%的人不知道的 Claude使用真相

刚刚,Anthropic 公布了99%的人不知道的 Claude使用真相

刚刚,Anthropic 公布了99%的人不知道的 Claude使用真相

就在刚刚,Anthropic 发布了一报告,名字听上去有点学术腔——《人类经济指数》。 但别被这个名字骗了,它是一份非常具体、非常当下的观察笔记,可以说和我们息息相关。 原文链接:https://ww

来自主题: AI技术研报
7928 点击    2025-09-15 23:12
刚刚,Claude 杀死了 Manus

刚刚,Claude 杀死了 Manus

刚刚,Claude 杀死了 Manus

刚刚,Claude 发布了一个重磅更新:可以直接生成Excel和PPT了! 现在,Claude可以直接创建和编辑各种文件: Excel表格、Word文档、PPT幻灯片、PDF文件,通通不在话下。

来自主题: AI资讯
9601 点击    2025-09-15 08:38
弃坑Claude!亲测CodeBuddy Code:单人2小时,从0搭建部署电商推荐系统

弃坑Claude!亲测CodeBuddy Code:单人2小时,从0搭建部署电商推荐系统

弃坑Claude!亲测CodeBuddy Code:单人2小时,从0搭建部署电商推荐系统

作为一名有着8年全栈开发经验的技术人员,我最近接手了一个具有挑战性的项目:为某中型服装电商平台开发一套智能商品推荐系统。该系统需要在2个月内完成,包含以下核心功能:

来自主题: AI技术研报
7403 点击    2025-09-11 12:42