一种基于SASFV聚合模型的说话人确认方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于SASFV聚合模型的说话人确认方法
申请号:CN202511282711
申请日期:2025-09-09
公开号:CN120766685B
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了一种基于SASFV聚合模型的说话人确认方法,涉及语音识别领域,该方法通过短时傅里叶变换和梅尔滤波提取对数梅尔谱图,利用ERes2Net网络生成帧级特征,并引入SASFV聚合模型结合Fisher Vector变量、自注意力机制和统计方法生成固定长度的说话人级特征,最终通过余弦距离判定说话人身份。本发明解决了现有技术在短语音任务中无法有效表征和聚合特征的问题,显著提升了说话人识别系统的准确率、鲁棒性和性能。
技术关键词
短时傅里叶变换 说话人身份 统计方法 说话人识别系统 滤波器 注意力机制 预测输出值 高斯混合模型 概率密度函数 音频特征 线性 协方差矩阵 网络 样本 信号 语音 鲁棒性 功率 参数
系统为您推荐了相关专利信息
异常检测方法 ARMA模型 离散小波变换 风险 数据
神经网络预测器 机器人航位推算 协方差矩阵 误差预测方法 在线
残差预测 运动学特征 XGBoost算法 观测器 表达式
特征数据库 专用识别 短时傅里叶变换 混合网络 动态更新
反步控制方法 无人艇编队 神经网络辨识器 扰动观测器 控制器