一种基于热掩膜约束的跨模态文本到红外图像生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于热掩膜约束的跨模态文本到红外图像生成方法
申请号:CN202511309503
申请日期:2025-09-15
公开号:CN120807718B
公开日期:2025-11-18
类型:发明专利
摘要
本发明属于红外图像技术领域,涉及一种基于热掩膜约束的跨模态文本到红外图像生成方法,该方法包括:基于大模型构建文本‑红外图像对数据集;采用均值法确定红外图像的灰度阈值,并利用灰度阈值生成红外图像热掩膜信息作为热掩膜信息约束;训练自编码器以对红外图像进行重建;使用文本‑红外图像对数据集和时间编码作为输入,利用潜在扩散模型、自编码器和热掩膜信息约束训练得到红外图像生成模型;使用高斯噪声、文本‑红外图像对数据集中的文本和时间编码作为输入,利用红外图像生成模型生成红外图像。其有益效果是,有效提升生成红外图像的热特性表达能力,实现在无可见光输入条件下从文本生成高质量红外图像的目标。
技术关键词
图像生成方法 生成红外图像 图像生成模型 掩膜 编码器 红外图像技术 文本摘要模型 解码器 可见光图像 数据 图像组合 噪声 处理器 存储设备 可读存储介质 校正 像素