模型压缩方法、装置及电子设备

申请号：CN202510395992

申请日期：2025-03-31

公开号：CN120373370A

公开日期：2025-07-25

类型：发明专利

摘要

本申请公开了一种模型压缩方法、装置及电子设备，属于人工智能领域，用以解决相关技术中模型压缩效果不佳的问题。包括：获取待压缩的神经网络模型中各目标网络层的第一权重矩阵；针对每个目标网络层，根据目标网络层的原始输入数据和第一权重矩阵，对第一权重矩阵中的每个权重参数进行重要性评估，得到评估结果；根据评估结果和预设拆分策略，将第一权重矩阵拆分为重要参数矩阵和非重要参数矩阵；从各目标网络层中的首个目标网络层开始，根据重要参数矩阵和非重要参数矩阵，对待压缩的神经网络模型逐层进行压缩处理，直至全部目标网络层压缩完成，得到压缩后的神经网络模型。

技术关键词

矩阵神经网络模型模型压缩方法参数计算机可执行指令数据误差电子设备可读存储介质策略处理器模块存储器元素