一种基于扩散模型的图像生成身份个性化方法

申请号：CN202511471948

申请日期：2025-10-15

公开号：CN120953049B

公开日期：2025-12-12

类型：发明专利

摘要

本发明提供了一种基于扩散模型的图像生成身份个性化方法，包括：步骤1，构建身份语义解耦训练框架：建立身份增强模型，所述身份增强模型在原始SDXL1.0模型上额外引入了图像交叉注意力模块；步骤2，建立混合注意力融合机制，然后进行混合注意力融合；步骤3，风格生成：在原始SDXL1.0模型的自注意力层中对键、值特征执行混合操作，即一种结合自适应均值归一化与均值对齐的操作，以进一步将合成图像的风格与输入的风格提示对齐。本方案在保持文本语义编辑能力的前提下，突破现有方法在身份一致性保持方面的局限，定制化生成双人图像，而且能够控制生成图像的风格，适用于数字内容创作、虚拟形象生成等需要精准身份控制的场景。

技术关键词

注意力分支人脸识别模型身份键值个性化方法图像编码器风格双人文本融合语义图像嵌入人脸检测模型控制策略定位人脸对齐模块