一种基于SASFV聚合模型的说话人确认方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于SASFV聚合模型的说话人确认方法
申请号:
CN202511282711
申请日期:
2025-09-09
公开号:
CN120766685B
公开日期:
2025-11-18
类型:
发明专利
摘要
本发明公开了一种基于SASFV聚合模型的说话人确认方法,涉及语音识别领域,该方法通过短时傅里叶变换和梅尔滤波提取对数梅尔谱图,利用ERes2Net网络生成帧级特征,并引入SASFV聚合模型结合Fisher Vector变量、自注意力机制和统计方法生成固定长度的说话人级特征,最终通过余弦距离判定说话人身份。本发明解决了现有技术在短语音任务中无法有效表征和聚合特征的问题,显著提升了说话人识别系统的准确率、鲁棒性和性能。
技术关键词
短时傅里叶变换
说话人身份
统计方法
说话人识别系统
滤波器
注意力机制
预测输出值
高斯混合模型
概率密度函数
音频特征
线性
协方差矩阵
网络
样本
信号
语音
鲁棒性
功率
参数
系统为您推荐了相关专利信息
1
基于小波变换与ARMA建模的AD步态异常检测方法
异常检测方法
ARMA模型
离散小波变换
风险
数据
2
基于机器人运动和地表感知的在线航位推算误差预测方法
神经网络预测器
机器人航位推算
协方差矩阵
误差预测方法
在线
3
考虑频率分布差异的动力学模型残差补偿机器人碰撞检测方法及系统
残差预测
运动学特征
XGBoost算法
观测器
表达式
4
一种基于深度学习的DAS防外破方法及系统
特征数据库
专用识别
短时傅里叶变换
混合网络
动态更新
5
一种用于无人艇编队的规定性能最优反步控制方法及系统
反步控制方法
无人艇编队
神经网络辨识器
扰动观测器
控制器