分离式架构LoRA模型训练方法

申请号：CN202511255749

申请日期：2025-09-04

公开号：CN120804720A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及机器学习模型训练技术领域，公开了分离式架构LoRA模型训练方法。该方法实时获取初始训练数据集并提取初始特征序列，待训练LoRA模型包含多个分离式模块。从初始特征序列中提取交互特征，基于此根据不同模块的训练数据分辨率生成精细程度不同的模块，得到多粒度特征分布。分析训练序列得到训练载荷谱，基于此计算分离式模块的梯度分布，得到梯度状态数据。再根据梯度状态数据识别参数更新次数，结合模型更新规则得到剩余更新量，进而得到最终训练参数。该方法还包括响应分析指令得到目标模块的梯度分析结果等步骤。此方法能提升模型训练效果和适应性。

技术关键词

分离式模块模型训练方法交互特征多粒度特征特征提取网络数据子模块唯一性队列序列分辨率机器学习模型训练模块体统计特征模型更新载荷标识基础立体