摘要
本发明提供了一种基于大模型的文档识别与校核方法及装置,方法包括获取待识别的文档,将所述文档转换成图片格式,将得到的文档图片输入到预训练的视觉大模型中,输出识别到的信息;将所述视觉大模型识别到的信息输入到语言大模型中,通过提示词工程撰写需要提取的字段信息,引导语言大模型对输入信息进行关键词提取,将所需提取的字段信息以结构化的方式输出;配置校核规则,包括构建校核脚本以及校核规则知识库;将输出的数据输入到校核大模型中,校核大模型结合RAG检索增强生成技术构建动态双引擎检索机制,对输入的信息进行校核;生成校核结果,并进行可视化展示。本发明能够提高各类文档识别的准确率和鲁棒性。