基于多轮问答的临床试验资格标准中实体关系自动抽取方法和系统
申请号:CN202411064912
申请日期:2024-08-05
公开号:CN118917307B
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了一种基于多轮问答的临床试验资格标准中实体关系自动抽取方法和系统,方法包括以下步骤:对获取的临床试验资格标准文本进行预处理得到自由文本;定义实体类别和关系类别并对自由本文进行标注,并设计头实体问题模板和尾实体问题模板;构建头实体问答和尾实体问答的阳性样本和阴性样本对BERT‑BiLSTM‑CRF模型进行训练;将头实体问题与自由文本拼接后输入训练后的模型预测得到头实体名称,再将头实体名称替换至尾实体问题中并与自由文本再次拼接后输入模型预测得到尾实体名称,通过多轮问答使模型最终预测出自由文本中的所有实体及其关系。本发明能实现在复杂的临床试验资格标准的临床场景下的高精度实体关系自动抽取。
技术关键词
文本
CRF模型
模板
实体关系抽取
答案
样本
模型训练模块
定义
临床场景
标签
抽取系统
抽取设备
存储计算机程序
数据
存储器
处理器