基于词典的政企非结构化数据要素解析组件实现方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于词典的政企非结构化数据要素解析组件实现方法
申请号:CN202511249144
申请日期:2025-09-03
公开号:CN120745604A
公开日期:2025-10-03
类型:发明专利
摘要
本发明提供基于词典的政企非结构化数据要素解析组件实现方法,涉及数据处理技术领域,包括对非结构化数据分词,构建特征矩阵;在纵向建立字符前缀树,横向构建属性关联表,设置交叉引用指针及属性继承机制;将属性增强实体词划分为子词典分片,根据语义关联强度分配至多个要素解析通道并行处理;最后合并解析结果生成结构化数据要素集合。本发明提高了政企数据要素解析的准确性和效率。
技术关键词
词典 分片 生成结构化数据 节点 字符 哈希算法 指针 多维特征向量 通道 计算机程序指令 深度优先搜索算法 双向注意力机制 属性匹配 拓扑特征 语义依存分析 关系网络 矩阵 信息熵