# 热门搜索 #
搜索
搜索: SWE-bench
OpenAI「草莓」模型再次跳票,凌晨发布的SWE-bench Verified是个啥?

一直以来,大模型的编程能力都备受关注,超强 AI 程序员 Devin 的问世更是将「AI 能否替代程序员」这一话题推上了风口浪尖。最近,Devin 也迎来了新对手 —— 初创公司 Cosine 推出的自主 AI 程序员 Genie。该公司表示,Genie 的表现轻松超越了 Devin,在第三方基准测试 SWE-bench 上的得分为 30%,而 Devin 的得分仅为 13.8%。

来自主题: AI资讯
6825 点击    2024-08-14 17:29