图像生成方法、装置、电子设备及可读存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
图像生成方法、装置、电子设备及可读存储介质
申请号:CN202410772854
申请日期:2024-06-14
公开号:CN118736038A
公开日期:2024-10-01
类型:发明专利
摘要
本申请涉及图像生成领域,提供了一种图像生成方法、装置、电子设备及可读存储介质。该方法包括:获取文本描述和图像信息,将所述文本描述和所述图像信息输入至多模态扩散模型;利用所述文本编码器对所述文本描述进行编码处理,得到第一特征向量,并利用所述图像编码器对所述图像信息进行编码处理,得到第二特征向量;利用所述至少一条件编码器对所述图像信息进行特征提取,得到至少一条件特征向量;将所述第一特征向量、所述第二特征向量以及所述至少一条件特征向量输入到所述扩散生成器,得到所述扩散生成器输出的目标图像。本申请可以改善现有模型生成的图像存在失真和模糊问题,提高生成图像的图像细节和真实性。
技术关键词
文本编码器 图像编码器 多语言 图像生成方法 人物特征 多模态 噪声图像 空间结构特征 图像生成装置 训练集 英语 电子设备 可读存储介质 风格 处理器