一种基于多模态大语言模型的智能审图方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多模态大语言模型的智能审图方法及系统
申请号:CN202511285694
申请日期:2025-09-10
公开号:CN120783365A
公开日期:2025-10-14
类型:发明专利
摘要
本申请涉及图像处理领域,公开了一种基于多模态大语言模型的智能审图方法及系统,其中方法包括:获取待审查的目标工程设计图纸和审查任务描述;基于目标工程设计图纸生成全局概览图;通过多模态大语言模型根据全局概览图和审查任务描述进行全局语义分析,生成全局语义分析结果和待审查的局部区域提议信息;从设计图纸中裁剪局部图像;通过多模态大语言模型对局部图像进行要素识别解析,得到局部结构化信息;将局部结构化信息和全局语义分析结果进行信息融合处理,生成完整图纸信息后与结构化规范知识库进行合规性校验和缺陷定位,生成审查报告。本申请能够实现对电网工程设计图纸的智能化审查,提高审查效率和准确性,同时降低资源消耗。
技术关键词
工程设计图纸 大语言模型 审图方法 多模态 语义 电网工程设计 空间坐标信息 合规性 结构先验知识 视觉特征编码 报告 副本 多尺度信息 图像处理 人机交互界面 文本 关系 多分辨率