摘要
本发明公开了一种用于多模态文件的自适应分区存储方法:对多模态文件进行数据预处理,将音频数据转化为文本数据,将视频数据转化为文本数据和图像数据;提取多模态文件的文本特征和图像特征并进行加权融合,得到融合特征;构建自适应分类模型,以融合特征作为输入,利用深度神经网络对文本特征和图像特征共同进行优化,完成模型的迭代训练,将待分类文件的多模态信息输入训练好的模型中,得到文件分类结果;根据用户自定义配置和文件分类结果,为每个文件动态分配分类标签,并根据标签信息为文件匹配存储区域;对于不匹配的文件分类结果,由用户手动分配存储区域并对模型进行扩展学习。本发明实现了对大批量多模态文件的高精度自动化分区存储。