特定场景下图像数据集生成方法、装置、设备及存储介质

申请号：CN202510027513

申请日期：2025-01-08

公开号：CN120047767A

公开日期：2025-05-27

类型：发明专利

摘要

本公开涉及计算机技术领域，公开了特定场景下图像数据集生成方法、装置、设备及存储介质，该方法包括：将特定场景对应的文字信息输入大语言模型，得到提示词；将提示词输入扩散模型，生成与提示词对应的图像信息；基于图像信息，生成多种视觉标注，其中，视觉标注用于对图像信息添加标签标识；根据图像信息和多种视觉标注，构建特定场景下的图像数据集。本公开使用大语言模型和扩散模型生成特定场景下真实感强的图像信息，降低了采集真实数据的成本和时间，能够有效地生成特定场景下稀缺的图像数据，从而丰富图像数据集的多样性。

技术关键词

图像视觉生成方法大语言模型文件夹场景数据可读存储介质指令计算机程序产品文本编码模块参数存储器生成装置标签处理器计算机设备真实感

系统为您推荐了相关专利信息

地震道集索引生成方法、装置、电子设备及存储介质

索引生成方法地震道集计算机执行指令位置更新索引生成装置

一种基于机器视觉和AI算法的供水厂滤池运行异常工况识别方法和系统

工况识别方法滤池卷积神经网络提取旋转角坐标

一种景区碳火烧烤检测预警方法、系统、介质及处理器

检测预警方法烟雾气味传感器气味特征图像

一种基于AI的会议记录数据查找方法及系统

语义向量融合神经网络时间序列建模技术动态知识图谱会议场景