一种视觉任务处理方法、装置、电子设备、介质及产品
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种视觉任务处理方法、装置、电子设备、介质及产品
申请号:
CN202411909848
申请日期:
2024-12-24
公开号:
CN119851172A
公开日期:
2025-04-18
类型:
发明专利
摘要
本发明公开了一种视觉任务处理方法、装置、电子设备、介质及产品。所述方法包括:获取视频图像序列和用户指令;将所述视频图像序列和所述用户指令输入任务偏好模型中,通过所述任务偏好模型中的任务解码器和多模态大语言模型扩展新的视觉任务,输出视觉任务处理结果。该方法通过扩展新的视觉任务增强多模态大语言模型对视觉任务的理解能力,达到能够更精确的感知和理解视觉任务。
技术关键词
大语言模型
令牌
多模态
解码器
视频
序列
指令
图像
计算机程序产品
识别用户意图
标记
视觉特征
电子设备
标签
模板
可读存储介质
处理器通信