一种基于NL2SQL的大语言模型构建方法以及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于NL2SQL的大语言模型构建方法以及装置
申请号:CN202510546407
申请日期:2025-04-28
公开号:CN120448410A
公开日期:2025-08-08
类型:发明专利
摘要
本发明提供的基于NL2SQL的大语言模型构建方法以及装置,包括:获取原始数据集,对原始数据集进行预处理,以得到预处理后的原始数据集,确定预处理后的原始数据集中段落之间的逻辑关系,将逻辑关系相同的段落进行合并,以得到合并之后的数据集,提取合并之后的数据集中的关键信息,基于关键信息,构建训练数据集,其中,训练数据集包括多个问题以及每个问题对应的SQL语句,基于训练数据集,对大语言模型进行训练,以得到训练后的大语言模型。通过分析原始数据集中段落之间的逻辑关系,精简段落并提高提取短路中关键信息的效率。基于关键信息构建训练数据集,有效提升NL2SQL的准确性,降低数据集构建的难度,增强系统的实用性。
技术关键词
语言模型构建方法 数据 语句 文本 模型构建装置 字段 语义 索引 大语言模型 关系 模块 模板 动态 短路
系统为您推荐了相关专利信息
人工智能图像识别 融合图像特征 生成高质量图像 卷积神经网络提取 图像预处理技术
资源优化调度系统 智慧农业 动态 植入式传感器 探针
动态监测数据 灾害预警方法 预警模型 预警平台 模型库
楼宇管理系统 综合管理平台 能耗数据采集网关 缴费管理 设备设施监控
检测试剂盒 环境控制方法 质谱 代表 量子旋转门