一种基于大模型的提取文档可信证据方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于大模型的提取文档可信证据方法及系统
申请号:CN202511286783
申请日期:2025-09-09
公开号:CN120783359A
公开日期:2025-10-14
类型:发明专利
摘要
本发明公开了一种基于大模型的提取文档可信证据方法及系统,包括以下步骤:破损文档证据完形推理:构建图像、文本双分支模型,其中:图像分支通过融合跨模态注意力机制的改进型架构捕捉文档破损区域的边缘纹理,生成缺失区域的像素级预测掩码;文本分支基于在BERT基础上增加领域术语嵌入层并经文档证据语料微调的衍生模型,对残缺文本进行掩码语言建模,结合上下文语义及领域术语库生成候选补全内容,本发明通过图像、文本双分支模型的跨模态融合机制,结合改进型物理破损特征提取与领域适配语义补全模型,使破损文档证据提取的完整性与准确性显著提升,实现了破损区域像素级修复与语义逻辑连贯的双重优化。
技术关键词
溯源数据库 光学字符识别 红外扫描仪 检测挥发性有机物 文本 检测子系统 分支 术语 气相色谱仪 贝叶斯神经网络 跨模态 多标签分类器 指纹 交叉注意力机制 语义特征 实体 图像 工业相机