AI资讯新闻榜单内容搜索-SWE-agent

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: SWE-agent
从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

从MiniMax到DeepSeek:为何头部大模型都在押注「交错思维」?

昨日,有位推特博主晒出了国内几大开源模型在轻量级软件工程 Agent 基准测试 mini-SWE-agent 上的成绩。该基准主要测试大模型在真实软件开发任务中的多步推理、环境交互和工程化能力。

来自主题: AI技术研报
8990 点击    2025-12-04 16:25
普林斯顿首个「开源」AI程序员登场!爆改GPT-4,93秒修bug

普林斯顿首个「开源」AI程序员登场!爆改GPT-4,93秒修bug

普林斯顿首个「开源」AI程序员登场!爆改GPT-4,93秒修bug

世界首个AI程序员Devin诞生不足一个月,普林斯顿就推出了全新的「开源版本」——SWE-agent!在GPT-4的加持下,debug只需93秒,准确率几乎不相上下。

来自主题: AI技术研报
8396 点击    2024-04-03 15:26
GPT-4加Agent轻松追平Devin!普林斯顿造,开源首日斩获1.6k星

GPT-4加Agent轻松追平Devin!普林斯顿造,开源首日斩获1.6k星

GPT-4加Agent轻松追平Devin!普林斯顿造,开源首日斩获1.6k星

用GPT-4打造的AI程序员,结果轻松追平Devin!普林斯顿打造的开源SWE-agent,直接开箱即用——修复GitHub存储库中真实bug。在25%的SWE-bench测试集上,它实现了与Devin相似的准确度—— 解决了12.29%的问题。

来自主题: AI技术研报
9319 点击    2024-04-03 14:40