基于国际音标的发音词典自动构建方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于国际音标的发音词典自动构建方法、装置、设备及介质
申请号:CN202411112591
申请日期:2024-08-14
公开号:CN119107938A
公开日期:2024-12-10
类型:发明专利
摘要
本发明提供了一种基于国际音标的发音词典自动构建方法、装置、设备及介质,包括:建立以音素为隐变量的语音识别模型;使用联合随机近似方法对语音识别模型进行训练以及优化,实现自动构建发音词典。本发明能够完成输入音频特征序列即可得到其音素和文本的对应,相对于现有的技术,其利用预训练的模型能够在一种新的语言上进行任务,使用预训练的模型,能够方便地迁移到另一种新的语言上进行训练,得到该语言的发音词典,正确率高,同时便于维护,成本较低。
技术关键词
发音词典 自动构建方法 语音识别模型 音频特征 特征矢量序列 语音特征 神经网络参数 变量 词语 解码器 编码器 处理器通信 正确率 电子设备 介质