摘要
本发明属于自然语言处理技术领域,具体涉及了一种文献检索语句的生成方法、系统及设备,旨在解决结构化查询语句转换的准确性和效率低的问题。本发明基于学术文献数据库对人工标注数据进行扩充,在较少人工标注数据上实现数据集的构建,降低人工数据标注的工作量。通过获取各种领域学术性对话数据,确保训练后语句生成模型的智能对话水平、结构化查询语句的生成能力与泛化能力,显著降低语句生成模型训练过程中的计算与存储成本,并在较短的时间内获得足够的知识来适应特定的应用场景。通过语句生成模型将检索提问转换为对应的结构化查询语句,提升结构化查询语句转换的准确率。