基于语音语料对齐与自适应融合的语音分类方法

申请号：CN202411060512

申请日期：2024-08-05

公开号：CN118571216B

公开日期：2024-11-01

类型：发明专利

摘要

本发明公开了基于语音语料对齐与自适应融合的语音分类方法，方法包括：构建语音分类数据集，并划分为训练集与测试集；构建语音分类网络模型，包括对齐构造模块、语音关联性构建模块、片段重要性挖掘模块、融合检测模块；将融合检测模块输出特征输入分类器以获得预测结果；设计用于优化网络模型参数的损失函数，根据损失函数在训练集上采用Adam优化器实现模型参数的迭代优化与更新；训练完成的语音分类网络模型可实现对语音信号的端对端分类。本发明利用深度学习技术通过语音信号实现自动分类，可应用于不同场景，如对情感、性别、年龄等特征的识别，有助于企业分析用户的情感、性别、年龄，从而提供更人性化、更具针对性的服务。

技术关键词

语音分类方法分类网络数据分类模块交互特征嵌入特征优化器分类器梯度下降算法对齐工具深度学习技术超参数特征提取器注意力机制传播算法输出特征