一种基于大语言模型的科技文献表格知识链生成方法

申请号：CN202511056789

申请日期：2025-07-30

公开号：CN120930615A

公开日期：2025-11-11

类型：发明专利

摘要

本申请提供了一种基于大语言模型的科技文献表格知识链生成方法，涉及语义处理技术领域，所述方法包括：接收源自科技文献的表格图像、PDF提取区域和结构化源码，结合表格上下文信息生成初始输入信息；调用多模态大语言模型进行表格内容识别和结构化处理；基于初始HTML结构表示与原始表格图像及表格上下文信息执行迭代自校正；基于预设科学实体本体，对高保真HTML结构表示进行语义信息抽取；根据预设逻辑范式和实体抽取结果，组织成知识链。通过本申请可以解决现有技术中由于在处理复杂和非规范化表格时易出现识别错误，且深度逻辑关系挖掘能力不足，导致内容识别精度不足的技术问题，提高了表格内容识别和结构解析的精度。

技术关键词

大语言模型表格生成方法实体校正科技物理布局信息深度语义分析逻辑合并单元格生成知识语义层面文本段落多模态图像组织精度

系统为您推荐了相关专利信息

基于双目视图的区域化色彩校正方法与系统

色彩校正方法三维点云模型像素点颜色贴图

一种人才推荐方法、装置、设备和存储介质

人才推荐方法信息提取模型画像大语言模型计算机可执行指令

基于无人机设备的实体对象遍历识别检测方法和装置

识别算法货物储存区域无人机设备融合特征检测头结构

会议纪要生成方法、装置、设备、存储介质和程序产品

文本识别模型关键词音频会议纪要生成方法数据

一种冰雪场地融雪预警与智能除雪调度方法

除雪作业图谱微型气象站动态更新波动特征