一种基于大模型的文档识别与校核方法及装置

申请号：CN202511503346

申请日期：2025-10-21

公开号：CN120975100A

公开日期：2025-11-18

类型：发明专利

摘要

本发明提供了一种基于大模型的文档识别与校核方法及装置，方法包括获取待识别的文档，将所述文档转换成图片格式，将得到的文档图片输入到预训练的视觉大模型中，输出识别到的信息；将所述视觉大模型识别到的信息输入到语言大模型中，通过提示词工程撰写需要提取的字段信息，引导语言大模型对输入信息进行关键词提取，将所需提取的字段信息以结构化的方式输出；配置校核规则，包括构建校核脚本以及校核规则知识库；将输出的数据输入到校核大模型中，校核大模型结合RAG检索增强生成技术构建动态双引擎检索机制，对输入的信息进行校核；生成校核结果，并进行可视化展示。本发明能够提高各类文档识别的准确率和鲁棒性。

技术关键词

校核方法规则知识库文档图像数据生成技术模糊文档图像计算机可读取存储介质融合业务系统视觉关键词数据获取装置自定义脚本强化学习算法段落结构图片处理器注意力机制核装置