基于思维链增强的垂直领域大模型尺度化方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于思维链增强的垂直领域大模型尺度化方法及系统
申请号:CN202510731836
申请日期:2025-06-03
公开号:CN120633850A
公开日期:2025-09-12
类型:发明专利
摘要
本发明提供一种基于思维链增强的垂直领域大模型尺度化方法及系统,包括:基于目标垂直领域的行业术语库和输入文本构建动态提示模板,将动态提示模板和输入文本输入深度神经网络模型中进行批处理以生成推理路径数据,对推理路径数据进行质量过滤,输出标准化逻辑链数据集;基于标准化逻辑链数据集和通用数据集实施渐进式混合训练策略,将标准化逻辑链数据集与通用数据集进行动态配比,同时通过基于注意力和梯度裁剪的双重优化机制对垂直领域大模型进行训练;通过混合精度训练与显存动态管理实现垂直领域大模型全参数调整的资源优化,输出优化模型。本发明可实现大模型向轻量化面模型的精准知识迁移与计算强度降维,使模型可以在低资源场景中应用。
技术关键词
行业术语 深度神经网络模型 数据 逻辑 动态 文本 加权损失函数 注意力 模板 覆盖率 样本 精度 关键词 策略 专业特征 表达式 强化特征 参数 掩码矩阵 大语言模型