AI资讯新闻榜单内容搜索-mini-SWE-a

从MiniMax到DeepSeek：为何头部大模型都在押注「交错思维」？

昨日，有位推特博主晒出了国内几大开源模型在轻量级软件工程 Agent 基准测试 mini-SWE-agent 上的成绩。该基准主要测试大模型在真实软件开发任务中的多步推理、环境交互和工程化能力。

来自主题: AI技术研报

10030 点击 2025-12-04 16:25

只用100行代码，打造最强轻量编程agent。 SWE-bench、SWE-agent原班人马再出手，推出全新开源项目—— mini-SWE-agent。

来自主题: AI资讯

9600 点击 2025-07-28 14:50