摘要
本发明公开了一种基于自编码器结构的无标签数据深度学习方法,该方法包括获取无标签数据集并进行统一归一化预处理,构建标准化输入张量;通过变分自编码器结构的第一分支网络和语义表示提取的第二分支网络,分别提取潜在变量表示和语义表示;基于两者之间的对应关系,构建潜在空间对齐损失,并与重构损失、语义对比损失共同形成联合损失函数,实现两个分支网络的联合优化。最终输出经过优化的无标签数据特征表示,用于各类下游任务的数据输入。该方法有效提升了无标签数据的表征质量,增强了深度学习模型在无监督场景下的特征提取与表示能力,具有广泛的应用前景。