摘要
本发明公开了一种涉及智能驾驶技术领域的自动驾驶样本数据增强方法、装置、电子设备和介质,所述方法包括:获取原始样本数据集和第一隐空间向量,将第一隐空间向量输入到预先训练的生成式对抗网络,生成与原始样本数据集相关的伪图像;采用图像语义模型对原始样本数据集和伪图像进行聚类分析,通过反推机制获得每个聚类簇对应的提示词,并基于统计分析从每个聚类簇对应的提示词中选取得到目标提示词集合;将目标提示词集合、原始样本数据集和伪图像共同输入至扩散模型中,生成补充样本数据集。采用该方法能够扩充原始样本数据集的样本数量,并使得样本数据均衡分布,有利于提高后续训练模型的泛化能力。