摘要
本发明公开了一种基于多模态解析的税务政策文件处理方法,属于税务政策文件处理技术领域,包括:根据税务政策文件,通过区域划分,以识别区域类型,并得到置信度;根据置信度自大而小排序,得到第一置信度及第二置信度,当第一置信度及第二置信度的差值大于等于置信阈值时,则确定文件区域为第一置信度对应的区域类型;否则,根据第一置信度及第二置信度对应的两个区域类型的类型重合率,调整确定文件区域对应的区域类型;根据得到的区域类型,对文件区域内的数据,执行数据预处理,提取单模态特征,通过税务政策文件中多个文件区域得到的单模态特征,进行多模态融合,以得到知识图谱。通过区域的准确划分,执行多模态融合,实现文件准确解析。