一种基于扩散模型文本引导的红外图像生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于扩散模型文本引导的红外图像生成方法
申请号:CN202511331586
申请日期:2025-09-18
公开号:CN120833402A
公开日期:2025-10-24
类型:发明专利
摘要
本发明公开了一种基于扩散模型文本引导的红外图像生成方法,包括:一、训练集图像的获取;二、构建扩散模型文本引导网络;三、将可见光红外训练集和图像天气文本描述经过扩散模型文本引导网络进行特征提取;四、在可见光红外训练集和图像天气文本描述经过扩散模型文本引导网络特征提取中构建总损失;五、基于总损失对扩散模型文本引导网络进行训练;六、基于训练好的扩散模型文本引导网络生成红外图像。本发明方法步骤简单、设计合理,利用天气文本描述天气状况,并基于可见光图像和天气文本描述的多模态信息耦合输入扩散模型文本引导网络训练,实现后续不同天气条件下的红外图像生成,提高红外图像的生成质量。
技术关键词
输出特征 图像生成方法 可见光图像 天气 计算机 积层 文本编码器 模块 解码器 生成红外图像 矩阵 网络 样本 像素点 上采样 训练集