模型训练方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
模型训练方法、装置、设备及存储介质
申请号:CN202510900699
申请日期:2025-06-30
公开号:CN120822567A
公开日期:2025-10-21
类型:发明专利
摘要
本公开提供了模型训练方法、装置、设备及存储介质,涉及计算机技术领域,尤其涉及神经网络模型、模型训练技术领域。具体实现方案为:由计算单元对存储于存储器中的目标模型的激活张量和权重张量,执行基于哈达玛预变换的量化矩阵乘法,以基于数据位宽更小的低精度张量生成线性层的输出张量;利用输出张量和所述目标模型的后续网络层完成前向传播,以得到损失值;根据损失值,通过反向传播算法更新存储于存储器中的目标模型的模型参数。利用本公开的技术方案,能够在保证模型训练精度的前提下,显著降低计算过程中的存储器资源占用和计算量,降低了训练成本。
技术关键词
传播算法 模型训练方法 精度 因子 矩阵 格式 存储器 数值 模型训练技术 优化器 模型训练装置 分布式训练 参数 线性 神经网络模型 计算机程序产品 处理器通信 信息更新