基于大模型跨模态语义先验的小样本图像分类方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于大模型跨模态语义先验的小样本图像分类方法及系统
申请号:CN202511059576
申请日期:2025-07-30
公开号:CN120912981A
公开日期:2025-11-07
类型:发明专利
摘要
本发明涉及图像处理技术领域,提出了一种基于大模型跨模态语义先验的小样本图像分类方法及系统,包括获取待分类图像对应的支持图像及类别名称,通过跨模态迭代提示生成每个类别对应的文本描述,然后,通过零样本方式合成与文本描述语义一致的合成图像,选取匹配度高于设定值的合成图像与原支持图像构成扩充后的支持集;将文本描述进行编码得到文本先验特征;基于文本先验特征对提取的支持图像特征进行增强;基于增强后的支持图像特征以及扩充后的支持集得到分类原型,进而得到分类结果;通过创新的跨模态迭代提示(CIP)和跨模态几何对齐(CGA),显著提升了小样本分类的泛化和对齐效果。
技术关键词
图像分类方法 语义先验 跨模态 原型 样本 图像生成模型 文本编码器 拼接模块 图像分类系统 视觉特征 多头注意力机制 分支 三元组 计算机 图像处理技术