一种视觉任务处理方法、装置、电子设备、介质及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种视觉任务处理方法、装置、电子设备、介质及产品
申请号:CN202411909848
申请日期:2024-12-24
公开号:CN119851172A
公开日期:2025-04-18
类型:发明专利
摘要
本发明公开了一种视觉任务处理方法、装置、电子设备、介质及产品。所述方法包括:获取视频图像序列和用户指令;将所述视频图像序列和所述用户指令输入任务偏好模型中,通过所述任务偏好模型中的任务解码器和多模态大语言模型扩展新的视觉任务,输出视觉任务处理结果。该方法通过扩展新的视觉任务增强多模态大语言模型对视觉任务的理解能力,达到能够更精确的感知和理解视觉任务。
技术关键词
大语言模型 令牌 多模态 解码器 视频 序列 指令 图像 计算机程序产品 识别用户意图 标记 视觉特征 电子设备 标签 模板 可读存储介质 处理器通信