摘要
本申请提供一种生成式扩散模型的动态混合精度量化方法及系统,其中,方法,包括:为生成式扩散模型的核心计算单元的每一激活层随机分配初始量化位宽,确定初始混合精度位宽配置方案;对采用初始混合精度位宽配置方案的生成式扩散模型进行量化感知训练,确定收敛后的生成式扩散模型的验证集损失;根据生成式扩散模型的验证集损失和初始混合精度位宽配置方案,采用改进冒泡排序策略和动态位宽交换机制,循环更新核心计算单元的每一激活层的位宽配置,确定生成式扩散模型的最优混合精度位宽配置方案。通过本申请,无需额外硬件辅助,实现自动化的生成式扩散模型的激活层间位宽优化排序和激活层位宽差异性适配,提高扩散生成质量并节约计算资源。