开源即登榜!登顶全球前十AI编程智能体,UCL初创团队开源Prometheus

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
开源即登榜!登顶全球前十AI编程智能体,UCL初创团队开源Prometheus
8847点击    2025-10-28 10:34

学界杀入主赛道!UCL 校园团队 EuniAI 抛出开源智能体 Prometheus,在 SWE-bench Verified 上 71.2% Pass@1、主榜实锤合并;成本低至 $0.23/issue。


来自伦敦大学学院(UCL)的初创团队EuniAI开源发布了AI软件智能体Prometheus


该系统在SWE-bench Verified上取得71.2%的Pass@1成功率,成绩已被官方确认并合并至主榜单。


令人瞩目的是,这一成果来自高校科研团队,却已与产业巨头同台竞技,展现出学术研发在AI工程领域的产业级突破。


从学术论文到全球榜单

高校科研的「产业级突破」


Prometheus源自论文:


开源即登榜!登顶全球前十AI编程智能体,UCL初创团队开源Prometheus

论文地址:https://arxiv.org/abs/2507.19942

开源代码:https://github.com/EuniAI/Prometheus

官网Demo:https://euni.ai/

官方榜单确认:https://github.com/SWE-bench/experiments/pull/339


开源即登榜!登顶全球前十AI编程智能体,UCL初创团队开源Prometheus


它不仅通过开源代码和Neo4J知识图谱技术,让AI「读懂代码」,还能在实际GitHub项目中实现自动修复错误、验证补丁,甚至生成可直接提交的修复说明。


🔥全球榜单:成绩亮眼


  • SWE-bench Verified:71.2% Pass@1(官方确认 merge)
  • SWE-bench Lite:35.33% Pass@1(开源模型SOTA)
  • 平均API成本:仅$0.23/issue


开源即登榜!登顶全球前十AI编程智能体,UCL初创团队开源Prometheus


技术亮点:让AI真正「理解」代码结构


Prometheus的突破在于:它不是提示工程的产物,而是图结构推理的系统性设计。


统一知识图谱(Unified Knowledge Graph)将代码结构整合文件结构、AST抽象语法树和文档信息,将复杂代码库转化为可推理的知识网络,实现多语言语法理解与跨文件依赖分析。


多智能体协作框架(Multi-Agent System)包含六个专职Agent,从问题分类、环境重现到补丁生成与验证,实现端到端自动化开发闭环。


跨语言与可扩展性覆盖Python、Java、Rust、C/C++、Go、TypeScript、PHP、Ruby等主流语言,支持真实世界项目自动构建与测试。


低成本+高可复现性 Prometheus使用DeepSeek-V3模型,性能与GPT-4o相近,但成本仅为其1/9。支持在笔记本级硬件上运行完整修复流程。


开源即登榜!登顶全球前十AI编程智能体,UCL初创团队开源Prometheus


在线Demo

从论文到真实工程的桥梁


为展示Prometheus的工程化能力,EuniAI团队在官网上线了交互式演示平台:👉https://euni.ai/


该平台支持用户直接连接项目,选择待修复任务,系统将自动完成以下全自动流程操作:


  1. 自动环境构建与依赖安装
  2. 问题分析与知识图谱检索
  3. 补丁生成与自动验证
  4. 结果可视化与差异对比(Diff View)


目前Demo版本支持Python与多语言项目,提供限量邀请码注册体验,并持续向学术机构与开发者开放内测合作。


我们希望AI不再只是「补代码」,而是理解项目结构、能独立调试和修复的工程伙伴。 ——EuniAI团队


EuniAI团队由UCL助理教授叶荷(HeYe)领衔,成员来自伦敦大学学院、KTH皇家理工学院和CMU等国际高校。


他们以「科研与开源并行」的方式,推动AI智能体真正落地,让学术创新真正服务于软件开发一线。


未来展望


EuniAI团队对下一代智能代码分析与自动修复系统的展望:


Prometheus的愿景,是让AI不仅写代码、修代码,更能理解整个软件生态,并与人类工程师共同进化。


未来,EuniAI团队计划让Prometheus拥有更强的「工程意识」:


  • 智能修复代理(Issue Resolution Agent):自动检测、修复并提交补丁,实现端到端自动化修复。


  • 知识图谱生成(Codebase → Graph):一键将代码库结构化,提升上下文检索与跨语言理解。


  • 项目记忆与学习(Agent Memory + Post-Train Model):让智能体具备项目经验与长期记忆,不断自我优化。


  • 自动构建与验证(Automated Build Agent):生成补丁后自动测试与验证,保障修复质量。


  • 生态集成(MCP & TerminalAutomation):支持Model Context Protocol与终端自动化,构建完整的AI工程流水线。


Prometheus不止是一款智能体系统,它是下一代代码理解与自动修复平台的起点。


🚀立即体验Demo!

👉https://euni.ai/


上传一个项目与待修复任务,见证AI从识别问题、生成补丁、到自动验证的全过程。


(限量邀请码正在开放中🔑)


参考资料:

https://arxiv.org/abs/2507.19942


文章来自于“新智元”,作者“KingHZ”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/