基于视觉分割和多模态大模型的气泡图生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于视觉分割和多模态大模型的气泡图生成方法
申请号:CN202511430520
申请日期:2025-10-09
公开号:CN120912711A
公开日期:2025-11-07
类型:发明专利
摘要
本申请提供了一种基于视觉分割和多模态大模型的气泡图生成方法,其中,该方法包括:获取目标图像,并将目标图像输入预先训练得到的参数识别模型中,识别得到目标图像中的参数信息;将目标图像以及参数信息输入预先训练得到的目标视觉分割模型中,由目标视觉分割模型从目标图像中分割出至少一个分割后图像;根据各分割后图像以及预先训练得到的多模态大模型,在目标图像上生成气泡图。本申请能够准确理解各分割后图像中参数的语义,并进行结构化整理与输出,从而直观展示气泡图,辅助质检与分析。并且,还能达到提升对复杂图纸中细小参数区域的识别精度、更好地适应不同类型的图像风格以及在有限训练资源下实现高效微调,避免过拟合的技术效果。
技术关键词
多层感知器 生成方法 编码特征 视觉 矩阵 气泡 图像编码器 参数识别模型 机器可读指令 解码器 图像特征编码 文本编码器 生成解码 电子设备 处理器 存储器 样本