基于大模型数据增强的文本实体识别模型构建方法和设备
申请号:CN202511306223
申请日期:2025-09-12
公开号:CN120995985A
公开日期:2025-11-21
类型:发明专利
摘要
本发明提供了一种基于大模型数据增强的文本实体识别模型构建方法和设备:先构建含预处理、句法依存分析、数据修正增强、上下文编码、句法增强、表示融合及序列解码处理单元的初始模型;训练样本经预处理得预处理文本,句法分析建初步依存图;大语言模型修正并增强文本与依存图,获后续用的文本序列和依存图;编码文本序列得初始表示向量,结合依存图增强向量;融合后解码输出含词元实体标注的预测标签;用含条件随机场结构损失的函数算损失,判断收敛,未收敛则更新参数继续训练,直至得目标模型。该方法借大语言模型优化扩充数据,结合句法依存强化特征,提升复杂文本命名实体识别能力。
技术关键词
文本实体识别
序列
模型构建方法
标签
训练样本数据
条件随机场
命名实体识别模型
大语言模型
分析处理单元
转移概率矩阵
BERT模型
更新模型参数
强化特征
解码
编码
预测误差