摘要
本发明公开一种用于分布式嵌入向量的训练方法及装置,涉及深度学习领域,包括批量读取训练数据,根据各训练数据的ID,确定训练数据对应的位置信息;根据位置信息,确定训练数据对应的嵌入向量;根据各嵌入向量的访问频率和预先确定的元素数量,确定各嵌入向量是否复制至第一类型的特征向量块;若是,从第一类型的特征向量块获取嵌入向量,并对嵌入向量执行数据并行策略;若否,根据位置信息,从第二类型的特征向量块获取嵌入向量,并对嵌入向量执行模型并行策略。本申请能够快速准确定位嵌入向量的存储位置,为训练过程提供高效数据支持;并根据嵌入向量的访问频率,采用两种不同的并行策略,充分利用数据的稀疏访问模式,有效减少通信开销。