摘要
本申请公开了一种图像识别网络的压缩方法及设备,涉及人工智能技术领域,包括:先基于预设初始比特进行伪量化得到初始伪量化后权重,再结合原始权重通过预设映射函数动态确定适配目标卷积层的目标量化比特,使量化精度能匹配不同卷积层的特征重要性差异,解决了传统方法因固定量化比特导致关键通道信息损失或量化不足的问题,达到减少量化过程中关键特征丢失、提升量化后模型精度的效果。进一步的,结合目标伪量化后权重和批归一化层统计参数求解缩放系数矩阵,以用于反映各通道的量化损失程度,再对下一相邻卷积层的权重进行针对性缩放,实现了量化损失的跨层精准补偿,解决了传统补偿方式忽略层间关联性、补偿效果差的问题。