AI资讯新闻榜单内容搜索-DeepSWE

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: DeepSWE

GPT-5.5反杀Claude登顶，AI编码旧榜不准了？

GPT-5.5反杀Claude登顶，AI编码旧榜不准了？

GPT-5.5反杀Claude登顶，AI编码旧榜不准了？

一个号称「零污染」的新基准 DeepSWE，用113道原创题撕开了旧编程榜单的遮羞布。

来自主题: AI资讯

8352 点击 2026-05-28 10:51

伯克利最强代码Agent屠榜SWE-Bench！用Scaling RL打造，配方全公开

伯克利最强代码Agent屠榜SWE-Bench！用Scaling RL打造，配方全公开

伯克利最强代码Agent屠榜SWE-Bench！用Scaling RL打造，配方全公开

新晋AI编程冠军DeepSWE来了！仅通过纯强化学习拿下基准测试59%的准确率，凭啥？7大算法细节首次全公开。

来自主题: AI技术研报

8662 点击 2025-07-07 15:46

上一页当前第1页,共1页下一页