针对多模态大模型的文本描述的调整方法、装置及设备

申请号：CN202411612907

申请日期：2024-11-12

公开号：CN119559434A

公开日期：2025-03-04

类型：发明专利

摘要

本申请涉及一种针对多模态大模型的文本描述的调整方法、装置及设备，该方法确定第一样本图像并将其第一文本描述设置为第二文本描述；在第一样本图像中添加图像触发器得到第二样本图像；通过各第三样本图像和各第二样本图像，对添加的图像触发器和上下文生成器的参数进行调整；将样本图像通过图像编码器得到图像特征向量，将经上下文生成器得到的预测文本和样本图像对应的文本描述通过文本编码器得到文本特征向量，通过图像特征向量和文本特征向量进行特征对齐，得到多模态大模型针的输出文本，基于图像特征向量与文本特征向量之间的相似度确定损失函数，尽量保持多模态大模型的参数不变，并对多模态大模型的输出文本进行特定调整，提高调整效率。

技术关键词

图像特征向量文本特征向量样本多模态图像编码器文本编码器计算机程序代码计算机程序产品视觉特征存储程序指令阶段语义可读存储介质参数存储器

系统为您推荐了相关专利信息

一种柔性DNA存储微流控芯片

微流控芯片柔性索引数据存储荧光成像探针

一种反事实样本解释方法、系统、设备及存储介质

风险预测模型样本数据分布解释系统可读存储介质

目标丢包率获取方法、装置、设备及存储介质

样本服务器指标因子性能预估模型

借贷风险评估方法、电子设备及存储介质

企业画像借贷风险评估方法客户特征提取模型训练样本集

一种基于深度学习的智能配变终端数据处理方法

智能配变终端深度学习组合模型数据处理方法深度学习模型长短期记忆网络