摘要
本公开提供了一种模态统一的数据处理方法、装置、设备及存储介质,涉及人工智能技术领域,尤其涉及深度学习、大模型等技术领域。具体实现方案为:利用第一门控网络,根据输入词元的向量特征,确定与注意力层中的多个注意力专家对应的多个第一权重参数;基于多个第一权重参数,使用多个注意力专家中的至少一个被激活的注意力专家对输入词元进行处理,以得到注意力层输出向量;利用第一残差连接和层归一化层,根据注意力层输出向量和输入词元,生成中间词元;利用前馈网络层,对中间词元进行处理,以生成输出词元。根据本公开实施例的方案,可以有效缓解模态间干扰,使单一模型能够灵活、高效地处理多模态、多任务数据。