在科技日新月异的今天,专利作为保护创新成果的重要法律工具,其撰写过程却往往繁琐且耗时,传统的专利撰写工作通常由熟悉专利法律和技术领域的专利代理人完成,这一过程耗时费力,且效率较低。因此,开发一种能够自动化生成高质量专利文档的方法,对于提高专利撰写的效率和准确性具有重要意义。
最近,来自中科院深圳先进院和大连理工大学的研究团队联合开发了一个名为AutoPatent的自动化的多智能体专利生成框架,能够在十分钟左右的时间依据发明人的专利技术底稿生成一篇完整的专利文档。
论文地址:https://arxiv.org/abs/2412.09796
代码链接:https://github.com/QiYao-Wang/AutoPatent
一份完整的专利申请文件通常包含标题、摘要、技术背景、详细描述和权利要求等内容,其平均长度在17,000 Tokens以上。以往的专利申请流程通常为发明人依据发明的具体可实施内容撰写专利技术底稿委托专利代理人起草专利申请文件。
专利起草是一个复杂的知识密集型任务,需要专利代理人对专利法熟悉并且具备该发明所属技术领域的知识,从而能够完成对发明人技术底稿的审查和规范化重写。
目前这一过程仍然完全由人工手动完成,具有较高的人力成本和时间成本,从技术交底书到正式向专利局提交的时间通常在一个月以上,无法有效保护迭代更新较快的技术领域的相关发明。
以往的专利撰写任务通常关注专利文件内部文本的相互转化,例如专利的摘要与权利要求之间的相互转化等。
研究人员通过模拟真实场景中的专利撰写工作,引入了一项新颖的专利起草任务Draft2Patent,将发明人技术底稿转化为完整的专利文件,提升专利代理人的专利撰写效率。
该任务主要有两个主要困难:
1.底稿和完整专利的平均长度分别为4,000 Tokens和17,000 Tokens。
2.一份高质量专利需要具有专利性(非显而易见性、有用性、新颖性以及符合专利法律规范),同时需要满足专业技术领域和法律的相关规范。
研究人员构建了Draft2Patent任务对应的基准数据集D2P,其中包含1,933条底稿专利文本对和其他元数据,并将其划分为包含1,500条数据的训练集,133条数据的验证集和300条数据的测试集。
随着大语言模型的发展,基于大语言模型的智能体展现了在知识密集型领域的意图理解、规划、记忆、重复思考及任务执行的强大能力。
针对Draft2Patent任务,研究人员提出了一个新颖的多智能体自动化专利起草框架AutoPatent,其中使用写作、规划及审查三大类八个智能体在短组件生成、专利写作规划树构建(PGTree)、参考-审查增强生成(RRAG)三步骤的驱动下完成完整专利的撰写。
该篇文章的主要贡献有:
通过自动化生成专利文档,文章提出的AutoPatent框架显著提高了专利撰写的效率,能够在十分钟左右的时间内生成一篇完整的专利文档,减轻了专利代理人和发明者的工作负担,使他们能够更专注于创新和专利内容的优化。
AutoPatent框架通过多智能体协作,其中规划智能体构建PGTree(Patent Writing Guideline Tree,专利写作指南树),专利详细描述写作智能体与审查智能体基于RRAG(Reference-Review-Augmented Generation,参考审查增强生成)协作撰写占据专利文本80%以上的详细描述部分,确保生成的专利文档符合法律和技术标准。这提高了专利的合规性和保护范围,增加了专利被授权的可能性。
文章提出的Draft2Patent任务和AutoPatent框架为知识产权服务领域带来了新的思路和方法。这有助于推动知识产权服务的创新和发展,提高整个行业的服务水平和竞争力。
对于单个专利P,研究人员将GPT-4o-mini模拟为人工智能助手总结专利P的详细描述中每一部分的内容,并将其组织构建为预设的双层多路专利写作规划树的数据结构。
统计数据集中各部分的文本长度后,可以看到标题、摘要、权利要求、总结及技术背景等内容的长度小于2000 Tokens,而专利的详细描述部分长度超过了14,000 Tokens,占据完整专利的80%以上,生成高质量专利详细描述是本基准的一大挑战。
研究人员提出了一个新颖的多智能体自动化专利起草框架AutoPatent,其中包含三大类八个智能体在三大步骤的驱动下完成完整专利的撰写。
在AutoPatent框架中,定义了八个智能体,并将其分为三类:写作智能体、规划智能体及审查智能体。
写作智能体:由于专利的各个部份之间存在着一定的格式及风格差异,如专利的摘要一般较短而权利要求通常为具有编号的结构化文本。将六个写作智能体分为两大类,即短文本写作者和详细描述写作者。
规划智能体:由于专利的详细描述的平均长度超过14,000 Tokens,为大语言模型一次性生成详细描述带来了困难。通过引入双层多路的专利写作规划树PGTree,指导详细描述写作者在RRAG过程中分步生成完整的详细描述。
审查智能体:通过模拟真实场景中的专利撰写步骤,定义了审查智能体。其需要依据事先设定的评价规范完成两类任务,即发明人提交新底稿后的质量审查和与详细描述写作者协作评估详细描述的质量并提供反馈达到优化的效果。
提供了相应的逻辑框图和伪代码。通过模拟真实场景中的专利撰写过程将AutoPatent框架的整体工作流程分为三步。
短组件生成:在Step I中,利用不同的短文本写作者将专利底稿并行转化为对应的短文本。之后将这些短文本与专利底稿共同组成参考(Reference, R)。
专利写作规划树构建:在Step II中,利用规划智能体构建该底稿对应的PGTree。PGTree是一个双层多路树,将详细描述的生成任务拆解为双层级的大纲式多步生成任务。第一层节点提供该部分的整体概述,第二层节点向详细描述写作者提供每个子部分的具体指令。
参考-审查增强生成:在Step III中,详细描述写作者首先根据PGTree中二层节点的具体写作指令从参考R中检索对该部分写作有用的信息,提升内容的一致性和可靠性。详细描述写作者之后根据二层节点的具体写作指令和检索到的内容生成子部分的内容,审查智能体将主动介入依据审查标准判断生成的子部分的质量,并通过与详细描述写作者的多轮交互完成子部分的内容优化,直至通过审查。
研究人员采用了n-gram基于的BLEU指标和ROUGE-1、ROUGE-2、ROUGE-L指标作为客观指标,同时提出了一种新的逆重复率(IRR)指标来衡量专利文档中句子的重复程度,从而去除由于重复句子过多对基于n-gram的指标的过度奖励。
其中真实专利的IRR在t=0.2时为91.33,t=0.4时为98.57,真实专利的文本重复率较低。
其中基于Jaccard相似度和设定的阈值超参数判断专利文本内部句子的重复,函数f(si, sj)定义为:
同时,实验邀请了三位熟悉专利法和专利撰写的人类专家对生成的专利文档进行质量评价。评价标准包括准确性、全面性、逻辑性、清晰度、连贯性和一致性等六个维度。
将AutoPatent框架与零样本提示生成方法和监督微调生成方法进行了对比,以评估AutoPatent框架的性能。
实验结果显示,AutoPatent框架在多个维度上均优于基线方法,其中AutoPatent框架使用Qwen2.5-7B作为基座模型时的性能超过了参数量更大和能力更强的模型,生成的专利文档在长度、内容质量、重复率等方面均表现出色。
与此同时,三位人类专家均认为基于AutoPatent框架生成的专利文本质量好于其他方法。
AutoPatent的出现在未来可能对知识产权行业产生深远影响:
1.专利生成流程重塑:传统的专利申请流程繁琐,涉及多次人工审核和修改。AutoPatent通过自动化生成和审查流程,将原本需要数周甚至数月的时间缩短至几小时或几天,极大地提高了效率。
2.降低专利书写难度,促进创新:AutoPatent的出现降低专利撰写难度,当专利撰写变得更为便捷和经济时,更多的创新想法将有机会转化为专利,从而激发整个社会的创新活力。
3.知识产权服务行业变革:随着AutoPatent等自动化工具的应用,知识产权服务机构将不得不探索新的服务内容和模式,如专利数据分析、专利价值评估等增值服务。
参考资料:
https://arxiv.org/abs/2412.09796
文章来自微信公众号“新智元”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner