基于预训练模型和词义增强的事件抽取系统及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于预训练模型和词义增强的事件抽取系统及方法
申请号:CN202411890968
申请日期:2024-12-20
公开号:CN119848229B
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了基于预训练模型和词义增强的事件抽取系统及方法,领域词向量获取模块得到领域词向量;数据集构造模块获取特定领域文本序列数据集;事件抽取模型构造模块构建事件抽取模型;训练模块将领域词向量作为事件抽取模型中Soft‑lexicon子模型中训练的初始设置,并利用已标注特定领域文本序列数据集对事件抽取模型进行训练;事件抽取模块利用训练好的事件抽取模型预测待检测特定领域文本序列数据集的标签序列结果。本发明通过利用预训练LERT子模型和利用Soft‑lexicon子模型将领域词向量的领域词汇信息纳入字符表示,并在模型中引入CRF层,提高事件抽取任务中标签标注的准确性,解决了特定领域事件抽取中,标注数据稀缺和专业性强、语境复杂的问题。
技术关键词
事件抽取系统 预训练模型 字符 序列 文本 标签 数据 Word2Vec模型 代表 模块 编码器 解码器 事件抽取方法 词典 词语 度评估方法 注意力 可读存储介质 格式