摘要
本申请实施例公开了一种图像生成方法、模型训练方法、装置、设备及存储介质,该图像生成方法包括:在接收到待生成图像的描述文本时,随机生成噪声图像;将所述噪声图像和所述描述文本输入图像生成模型,得到所述描述文本对应的第一预测噪声;所述图像生成模型在训练时是基于加入样本图像中的高斯噪声、预测的噪声分布以及分割掩码进行网络参数的调整的,所述分割掩码与所述样本图像所对应图像描述中的实体词和属性对应;根据所述噪声图像和所述第一预测噪声,生成所述描述文本所对应的目标图像。本申请实施例可以提高所生成的目标图像与描述文本之间的语义一致性和画面美观性,而且可以提高图像生成效率,可以节省存储成本。