一种融合多样态图像特征的待检测图像识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种融合多样态图像特征的待检测图像识别方法及系统
申请号:CN202511193406
申请日期:2025-08-25
公开号:CN121010826A
公开日期:2025-11-25
类型:发明专利
摘要
本发明提出一种融合多样态图像特征的待检测图像识别方法及系统,属于深度学习领域和计算机视觉领域,包括:S1:提取待检测图像的文本数据和图像特征,将输入提示词引导大语言模型,获取并融合描述含义的文字和图像特征的提示词,得到的图像文本描述;将输入文本编码器,得到特征向量;S2:将经过分片操作和线性排列投影,得到一维嵌入向量,将输入图像编码特征提取模块,获取图像纹理特征向量;S3:将和输入融合增强模块,进行特征融合增强,得到最终特征表示;S4:将输入到分类器中,确定是否为有害图像。本发明方法引入大语言模型,提高了有害图像的识别准确率。
技术关键词
图像识别方法 图像纹理特征 大语言模型 特征提取模块 文本编码器 图像编码 分类器 深度神经网络 分片 非暂态计算机可读存储介质 图像识别系统 文本特征向量 图像识别装置 光学字符识别 处理器 线性