基于循环BERT和角标记的航空事故文本数据抽取方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于循环BERT和角标记的航空事故文本数据抽取方法
申请号:CN202411521325
申请日期:2024-10-29
公开号:CN119377742B
公开日期:2025-09-23
类型:发明专利
摘要
本发明属于自然语言处理技术领域,具体涉及基于循环BERT和角标记的航空事故文本数据抽取方法,其包括:S1、使用双循环BERT模型识别航空事故报告文本数据的触发词;S2、使用分类器模型联合计算航空事故报告的文本数据论元向量;S3、根据文本数据触发词的向量和论元标签计算文本数据论元向量的总置信度;S4、使用角标记矩阵解码航空事故报告文本数据的事件三元组,得到文本数据的总损失值;S5、根据总损失值判断抽取航空事故报告文本数据。本发明通过双循环训练模型识别语境信息和论元位置,进而联合计算论元置信度降低冗余错误和级联误差,增加三元组预测正确率,使用角标记方法降低模型复杂度,增加抽取结果全面性。
技术关键词
分类器模型 文本 数据抽取方法 航空 三元组 BERT模型 双循环 解码 报告 矩阵 误差 标签 梯度下降优化算法 传播算法 参数 更新分类器 特征值 标记方法