摘要
本发明公开了一种SQL数据集生成方法及装置,涉及人工智能技术领域。所述方法包括:对文本数据进行信息提取处理,得到包括复杂度分布、业务规则以及查询模式的结构化文本数据;基于结构化文本数据,构建多个候选问答对;针对每个候选问答对,基于候选SQL语句在执行维度、匹配维度以及语法维度上的维度得分以及候选问题的复杂级别,计算第一质量得分;计算候选SQL语句在文本单元以及子句层级上的置信度,得到第二质量得分;融合第一质量得分以及第二质量得分,确定目标SQL数据集。本发明可确保快速生成高质量的目标SQL数据集。