摘要
本发明涉及文档智能审校技术领域,具体为基于大模型的多模态数字出版智能审校系统及方法,系统包括:样本构建模块、多模分析模块、结构识别模块、术语校验模块、注释输出模块。本发明中,通过对文本中主谓宾组合关系的解析与词性、句式、语义结构联合筛选生成模型配置数据集,提升语义识别与结构判断的精准性,结合图像动作路径与文本行为对象的比对关系,识别语义偏移及图文表达分离的局部特征,基于语义偏移信息分析段落逻辑结构与主题衔接方式,有效揭示段落之间的内容错位与主题跳转问题,针对术语跨段落语境中搭配变化轨迹与词性接续波动进行识别,并从句群层级分析标签交叠与覆盖冗余情况,形成标签合并建议并构建批注结构记录。