基于因果图与思维链增强的大模型微调方法及相关装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于因果图与思维链增强的大模型微调方法及相关装置
申请号:CN202510895436
申请日期:2025-06-30
公开号:CN120781920A
公开日期:2025-10-14
类型:发明专利
摘要
一种基于因果图与思维链增强的大模型微调方法及相关装置,涉及电力行业大模型微调技术领域,方法包括对电力设备数据进行因果挖掘,构建包含因果权重信息的电力设备因果图;将大模型的输入拆解为思维链,并根据思维链对应生成链式因果对,通过链式因果对与构建的电力设备因果图进行路径检索匹配与因果一致性检查,实现推理过程的对齐;通过推理过程的对齐结果激励强化学习过程,优化预先建立的强化学习奖励模型,约束思维链生成过程,引导大模型在因果约束条件下生成思维链,实现大模型微调。本发明将因果推理与因果性嵌入大模型微调的强化学习反馈过程,使得大模型能够学到基本的因果推理规则,能够提升思维链推理的逻辑性、解释性和鲁棒性。
技术关键词
微调方法 微调系统 电力设备运行信息 实体 评分方法 可扩展标记语言 图谱 推理规则 长短期记忆网络 策略 三元组 数据 生成动作 关系 对齐模块 样本 定义 鲁棒性