多模态文档内容跨平台解析系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态文档内容跨平台解析系统
申请号:CN202511211295
申请日期:2025-08-28
公开号:CN120726658A
公开日期:2025-09-30
类型:发明专利
摘要
本发明提供多模态文档内容跨平台解析系统,涉及数据处理技术领域,所述方法包括:文档预处理模块,用于接收多源异构文档输入数据,通过格式转换、页面分割、降噪及光学字符识别生成预处理文档;特征提取模块,用于基于预处理文档,提取三类特征,包括空间布局特征、语义特征和逻辑结构特征。本发明协同处理多源异构文档,实现跨平台解析中特征的精准提取、校准与关联,最终生成结构化数据,提升了多模态文档解析的准确性、一致性和跨平台适用性。
技术关键词
空间布局特征 解析系统 文本行 语义特征 层级 语义结构 光学字符识别 标识 多模态 关系 嵌套表格 坐标 逻辑 校准 句法结构 空间参考系 页面 列表