从最初斯坦福小镇火遍全网,25个由大语言模型(LLMs)驱动的智能体生活交友,打开了多Agent新视角。
而现在,AI法庭也来了!
最近,来自中科院深圳先进研究院的研究团队开发了一个名为AgentCourt的模拟智能法庭,
它是一个基于大语言模型(LLMs)的法庭模拟系统,旨在通过AI驱动的虚拟法庭来革新法律教育、案例分析和法律研究。
论文地址:https://doi.org/10.48550/arXiv.2408.08089
代码:https://github.com/relic-yuexi/AgentCourt
AgentCourt实战演示:https://b23.tv/e6eQMfM
该系统能够模拟完整的法庭程序。法官、原告律师、辩护律师以及其他参与者均由大型语言模型驱动的自主代理扮演。他们的主要目标是通过模拟法庭流程来帮助律师代理学习如何有效辩论案件,并提高其整体法律专业技能。
该篇文章的主要贡献有:
1. 全面模拟,真实再现
AgentCourt不仅仅是一个模拟工具,它是一个高度复杂的系统,能够精确模拟民事法庭的设置,实现多方互动和复杂的法律推理。这是首次将AI技术应用于法庭环境模拟中,为法律教育和实践提供了前所未有的可能性。
2. 对抗性交互,强化法律推理
在AgentCourt的模拟过程中,大型语言模型(LLMs)的法律推理能力通过智能体之间的对抗性交互得到了显著增强。这种利用对抗性多智能体交互的方法,不仅超越了简单的信息传递,更为未来的相关研究提供了新的视角和思路。
3. 高效模拟,真实案例验证
该工作成功模拟了1,000个中国真实的民事案例,这些案例在AgentCourt中仅用数天时间完成,而在现实世界中,这可能需要律师们花费十年时间。通过自动和人工评估方法,验证了智能体进化的有效性。
为了尽量真实的模拟法庭,研究人员设置了以下的人物:
1. 原告与被告代理
模拟开始于案件发生之前,两名由ERNIE-Speed-128K驱动的代理分别扮演潜在的原告和被告。一旦涉及案件,他们将自动寻求律师事务所的法律援助,这是法律纠纷中的典型行为。系统配置使得原告或被告在与律师的互动中可以直接获得诉状或答辩状,无需从头起草。
2. 律师代理
设计了两名律师代理,同样由ERNIE-Speed-128K驱动。当原告和被告在律师事务所寻求帮助时,这些律师代理将被随机分配为原告律师和被告律师。他们与各自的客户沟通,收集案件相关信息,并利用丰富的法律经验、案例先例和法定代码,按照规定程序进行法庭辩论,维护各自客户的利益。
3. 法官代理
在法庭中,法官负责监督整个过程,听取双方律师的论点,并在适当时候提问。最终,法官总结并评估律师的每一轮论点,然后作出最终判决。
4. 法庭书记员代理
为了创造更真实的法庭环境并促进代理的进化,他们设计了法庭书记员代理,负责宣布审判的开始和记录审判的全过程。
这些由大模型驱动的Agent,可以根据初始数据,自发地进行法庭的模拟,而无需任何人工的监督。
研究人员利用中国裁判文书网的数据,编译了一个包含10,000个民事判决的数据集。预处理的重点是提高数据集质量,精心清洗并选择了1,389个高质量案例,这些案例同时包含原告的诉求和被告的辩护。
为了解决潜在的重复问题,他们采用了BERT进行「案件介绍」部分的语义向量化,并使用K-Means聚类对相似文档进行分组。这产生了1,000个代表性文档,用于模拟法庭训练和测试。
数据生成与匿名化
利用ERNIE-Speed-128K API(百度智能云文档2024)生成并匿名化高保真模拟文本,这些文本专门针对民事判决。这产生了一个精选的数据集,包含1,000个训练样本和50个测试样本,旨在支持模拟法庭环境中强大的法律论证和判决预测,从而推进法律分析技术。
通过这些严格的数据处理步骤,AgentCourt确保了模拟环境的真实性和数据的可靠性,为法律AI的发展奠定了坚实的基础。
在得到数据后,各个Agent各司其职,根据一定的流程展开法庭的辩论。该论文的模拟过程如下:
在模拟完1000个民事案例后,原告律师和被告律师的能力都得到了很大的提升,文章中的自动评估和人工评估展示了实验结果:
实验基于1,000个真实世界的民事案件,通过自动评估和人工评估两种方式,全面检验了AgentCourt系统的效能。自动评估采用了LawBench评估标准,涵盖了法律知识的记忆、理解和应用三个层面。人工评估则由经验丰富的法律专家进行,评估了智能体的思维敏捷性、专业知识性和逻辑严谨性。
实验结果显示,在AgentCourt中经历了数千次对抗性法律案件模拟(相当于现实世界律师十年的工作经验),律师代理在处理法律任务的能力上有了显著提升。无论是在自动评估还是人工评估中,进化后的代理都展现出了更快的响应速度、更深的法律知识和更强的逻辑推理能力,在复杂案件分析、法律推理和辩论策略上,部分AI律师甚至超越了人类专家的表现。
就像自动评估中的Article Recitation任务,经过进化后的律师Agent可以较好的背诵出指定法律的内容。而未经进化的律师就只能「阿巴阿巴」了。
AgentCourt的出现在未来可能对法律行业产生深远影响:
1. 法律教育革新: 为法律院校提供高度仿真的实践平台,学生可与顶级AI律师对战,快速积累经验。
2. 提高司法效率: AI辅助可以加速案件预审、证据分析等流程,减轻法官和律师的工作负担。
3. 降低法律服务成本: AI律师助手可以处理大量初级工作,使优质法律服务更加平价可及。
4. 推动法律研究: 海量案例模拟为法学研究提供了前所未有的数据支持,助力发现新的法律模式和理论。
5. 伦理挑战: AI在法律领域的应用也带来了一系列伦理问题,如决策过程的透明度、AI偏见的控制等,需要社会各界共同探讨。
文章来源于“新智元”,作者“新智元”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI