摘要
本发明公开了一种基于命名实体识别和关系抽取的知识图谱构建方法,本发明采集电力领域语料,从语料中分割出句子,并对句子进行预处理;构建电力设备本体体系,包括类、属性和实例;收集实体识别训练集并将实体识别训练集输入双向长短期记忆网络进行训练,获得可用于实体识别的命名实体识别模型;获取输入句子的分词结果以及句法依赖树,在句法依赖树上构建图结构,将其放入擅长处理拓扑结构的GCN模型中,根据学习的权重矩阵预测关系,形成设备关联抽取模型;构建知识图谱。本发明无需人工过多参与,而且语料处理的速率远高于人工,进而可以使得可以在一定周期内识别更多的电力领域语料,进而使得最终构造的知识图谱更加完善。