AI资讯新闻榜单内容搜索-SWE-agent

从MiniMax到DeepSeek：为何头部大模型都在押注「交错思维」？

昨日，有位推特博主晒出了国内几大开源模型在轻量级软件工程 Agent 基准测试 mini-SWE-agent 上的成绩。该基准主要测试大模型在真实软件开发任务中的多步推理、环境交互和工程化能力。

来自主题: AI技术研报

10008 点击 2025-12-04 16:25

只用100行代码，打造最强轻量编程agent。 SWE-bench、SWE-agent原班人马再出手，推出全新开源项目—— mini-SWE-agent。

来自主题: AI资讯

9591 点击 2025-07-28 14:50

不到 24 小时，Star 量突破 1400。

来自主题: AI技术研报

11081 点击 2024-04-03 17:23

世界首个AI程序员Devin诞生不足一个月，普林斯顿就推出了全新的「开源版本」——SWE-agent！在GPT-4的加持下，debug只需93秒，准确率几乎不相上下。

来自主题: AI技术研报

8983 点击 2024-04-03 15:26

用GPT-4打造的AI程序员，结果轻松追平Devin！普林斯顿打造的开源SWE-agent，直接开箱即用——修复GitHub存储库中真实bug。在25%的SWE-bench测试集上，它实现了与Devin相似的准确度—— 解决了12.29%的问题。

来自主题: AI技术研报

9919 点击 2024-04-03 14:40