图像生成方法、模型训练方法、装置、设备及存储介质

申请号：CN202411448248

申请日期：2024-10-16

公开号：CN119540379B

公开日期：2025-08-01

类型：发明专利

摘要

本申请实施例公开了一种图像生成方法、模型训练方法、装置、设备及存储介质，该图像生成方法包括：在接收到待生成图像的描述文本时，随机生成噪声图像；将所述噪声图像和所述描述文本输入图像生成模型，得到所述描述文本对应的第一预测噪声；所述图像生成模型在训练时是基于加入样本图像中的高斯噪声、预测的噪声分布以及分割掩码进行网络参数的调整的，所述分割掩码与所述样本图像所对应图像描述中的实体词和属性对应；根据所述噪声图像和所述第一预测噪声，生成所述描述文本所对应的目标图像。本申请实施例可以提高所生成的目标图像与描述文本之间的语义一致性和画面美观性，而且可以提高图像生成效率，可以节省存储成本。

技术关键词

图像生成模型噪声图像注意力机制图像生成方法文本网络样本生成噪声模型训练方法参数属性匹配词语图像生成装置模块误差噪声预测处理器

系统为您推荐了相关专利信息

一种基于加性高斯扩散模型的图像降噪增强方法

高斯扩散模型噪声图像噪声样本网络噪声水平估计

一种基于改进自编码器及其数据清洗方法

双向长短期记忆数据清洗方法编码器注意力机制异常数据处理

文化遗产档案多维存储系统

存储系统双因子身份认证文化遗产数字化保护 Fabric区块链模块

基于PLGS-YOLO模型的地下电力光缆多场景振动区域定位方法

YOLO模型区域定位方法电力光缆模块多场景

一种胰腺癌靶区分割模型的训练方法

循环生成对抗网络图像生成模型胰腺癌患者解码模块像素