刚刚,OpenAI又双叒叕鸽了,没等来“草莓”发布,只敷衍发了评测集,网友:拿这来抢谷歌发布会风头?
刚刚,OpenAI又双叒叕鸽了,没等来“草莓”发布,只敷衍发了评测集,网友:拿这来抢谷歌发布会风头?Strawberry 的所有炒作都结束了。
来自主题: AI资讯
4320 点击 2024-08-14 11:46
Strawberry 的所有炒作都结束了。
自从 Devin(首个全自动 AI 软件工程师)提出以来,针对软件工程的 AI Agent 的设计成为研究的焦点,越来越多基于 Agent 的 AI 自动软件工程师被提出,并在 SWE-bench 数据集上取得了不俗的表现、自动修复了许多真实的 GitHub issue。
用GPT-4打造的AI程序员,结果轻松追平Devin!普林斯顿打造的开源SWE-agent,直接开箱即用——修复GitHub存储库中真实bug。在25%的SWE-bench测试集上,它实现了与Devin相似的准确度—— 解决了12.29%的问题。
首个AI软件工程师一亮相,直接引爆整个科技圈。只需一句指令,它可端到端地处理整个开发项目。