一种基于改进LLaVA的草莓病害多模态视觉问答方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于改进LLaVA的草莓病害多模态视觉问答方法
申请号:CN202511200131
申请日期:2025-08-26
公开号:CN121033635A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于改进LLaVA的草莓病害多模态视觉问答方法,属于人工智能技术领域,包括获取多种草莓病害植株图像,基于草莓病害植株图像构建草莓病害视觉问答数据集;对LLaVA模型进行改进;使用改进后的LLaVA模型进行微调,得到草莓病害视觉问答模型;根据草莓病害视觉问答模型进行问答。本发明采用上述方法,通过对LLaVA模型进行改进,提高了对草莓病害植株的识别能力,提高了模型对草莓病害诊断与决策的准确率。
技术关键词
草莓病害 视觉问答方法 视觉问答模型 视角 多模态 裁剪模块 高分辨率图像分割 增强子 大语言模型 局部细节特征 交叉注意力机制 训练集 人工智能技术 像素 模运算 矩阵