摘要
本申请公开了一种模型压缩方法、装置及电子设备,属于人工智能领域,用以解决相关技术中模型压缩效果不佳的问题。包括:获取待压缩的神经网络模型中各目标网络层的第一权重矩阵;针对每个目标网络层,根据目标网络层的原始输入数据和第一权重矩阵,对第一权重矩阵中的每个权重参数进行重要性评估,得到评估结果;根据评估结果和预设拆分策略,将第一权重矩阵拆分为重要参数矩阵和非重要参数矩阵;从各目标网络层中的首个目标网络层开始,根据重要参数矩阵和非重要参数矩阵,对待压缩的神经网络模型逐层进行压缩处理,直至全部目标网络层压缩完成,得到压缩后的神经网络模型。