基于语法和语义特征融合的蒙汉神经机器翻译方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于语法和语义特征融合的蒙汉神经机器翻译方法
申请号:CN202510440681
申请日期:2025-04-09
公开号:CN120430319A
公开日期:2025-08-05
类型:发明专利
摘要
一种基于语法和语义特征融合的蒙汉神经机器翻译方法,针对蒙古语低资源环境下的翻译挑战,从语法特征建模、语义特征融合及动态优化三个方面进行改进,以提升翻译的准确性、流畅度和词汇泛化能力。利用卷积层和自注意力机制提取局部与全局语法信息,动态调整注意力权重来引导Transformer模型关注语法相关内容,提升语法一致性;使用BERT预训练模型提取上下文语义信息,并结合嵌入Mixup和层级Mixup策略优化编码表示,在解码端融合低层语言特征与高层语义信息,增强译文的语义表达能力;采用不同粒度子词分割方式,并引入一致性损失优化翻译结果,在译文生成阶段结合Top‑k和Top‑p采样策略提升词汇忠实度和多样性。本发明能提高低资源语言翻译的质量和适应能力。
技术关键词
蒙汉神经机器翻译方法 语法特征 注意力机制 高层语义信息 解码器 语言编码器 上下文语义信息 前馈神经网络 多尺度语义特征 多层卷积神经网络 层级 语义信息提取 低资源语言 高层语义特征 卷积模块 序列