摘要
本发明提供一种水利知识结构化提取与校验方法及装置,属于人工智能技术领域,所述方法包括:对不同格式文件采用差异化文本处理生成中间文件;基于预设规则库将中间文件分类为条规类或非条规类;对条规类文件通过层级标题识别形成条目知识块,同时将表格内容转为HTML知识块;对非条规类文件进行语义分割生成知识块;实施知识块检验归档并标记异常告警块;利用大模型将表格知识块转化为自然语言描述;定位告警知识块原文上下文,通过大模型进行智能修正。本发明创新性融合传统语义分析模型与大语言模型,形成预处理、提取、校验、修正的闭环流程,解决水利领域复杂文本的结构化解析、及错误修正难题,显著提升知识处理效率与准确性。