模型训练方法、数据处理方法、装置、设备及存储介质

申请号：CN202410830602

申请日期：2024-06-25

公开号：CN118606896A

公开日期：2024-09-06

类型：发明专利

摘要

本发明公开了一种多模态数据处理模型的训练方法，包括：获取第一训练样本数据集，所述第一训练样本数据集由若干音频数据组成；通过所述第一训练样本数据集训练第一数据处理模型，获得预训练的第一数据处理模型；获取第二训练样本数据集，所述第二训练样本数据集包括：音频数据、文本数据、音频与文本混合数据；基于所述预训练的第一数据处理模型构建所述多模态数据处理模型，通过所述第二训练样本数据集对所述多模态数据处理模型进行端到端的训练，获得目标多模态数据处理模型。通过应用本方案，可以实现端到端的多模态数据处理模型的训练，避免现有技术中通过多个独立模块组合成的模型在处理数据过程中错误累积的问题。

技术关键词

数据处理模型训练样本数据多模态音频解码单元特征提取模型标识符生成样本数据特征提取器文本数据处理方法嵌入特征数据处理装置编码声学特征语义特征模型训练方法数据处理单元

系统为您推荐了相关专利信息

基于图像文本引导的机场跑道地下病害自动检测方法

机场跑道自动检测方法图像特征提取文本编码器图像编码器

脑电-眼动多模态数据融合的抑郁症早期筛查智能系统及方法

脑电信号采集模块智能系统表征受试者抑郁融合特征

一种土地资源监测方法及系统

资源监测方法双频全球定位系统数据地理信息系统多模态传感器

一种基于多模态知识融合增强的问答方法和装置

大语言模型溯源数据表格超文本标记语言图片

一种无麦克风的声学测算方法、系统、装置及介质