一种多语言大模型训练方法、装置及相关设备
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种多语言大模型训练方法、装置及相关设备
申请号:
CN202411739943
申请日期:
2024-11-29
公开号:
CN119670847A
公开日期:
2025-03-21
类型:
发明专利
摘要
本发明公开了一种多语言大模型训练方法、装置及相关设备,所述方法包括:获取平行语料数据,并基于子任务类型对其进行格式转换,得到与多个子任务类型对应的数据格式;将平行语料数据和数据格式输入初始多语言大模型,该模型包括子网络层,子网络层与子任务类型一一对应;计算每个子网络层的损失τ;根据每个子网络层的损失τ,计算全局损失L;利用该L对模型进行更新,得到更新后的多语言大模型。采用本发明可以提高平行语料数据的利用效率,并在不影响多语言大模型的能力的基础上提高其对低资源语种的理解能力。
技术关键词
平行语料数据
多语言
数据格式
模型训练方法
跨语言信息检索
命名实体识别
模型训练装置
可读存储介质
机器翻译
处理器
计算机设备
模块
存储器
算法
参数
矩阵
元素
资源
系统为您推荐了相关专利信息
1
一种代码审查方法、系统、设备、存储介质及程序产品
余弦定理
语义
计算机程序指令
仓库
计算机程序产品
2
模型训练方法、立场检测方法及立场检测装置、存储介质
模型训练方法
节点特征
计算机存储介质
生成知识
条件依赖关系
3
一种面向资源占用不确定性下的机场时刻容量评估方法
容量评估方法
时刻表
日期
典型
异常数据点
4
问答信息的生成及多模态大模型训练方法和装置
前馈神经网络
多模态
图像编码器
转换文本
视觉特征
5
基于优化三元组损失的语种识别模型训练方法及识别方法、系统
模型训练方法
样本
语种识别系统
语种识别方法
三元组损失函数