基于视觉语言模型的印章识别方法、设备、介质和产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于视觉语言模型的印章识别方法、设备、介质和产品
申请号:CN202511155745
申请日期:2025-08-18
公开号:CN121033526A
公开日期:2025-11-28
类型:发明专利
摘要
本申请提供一种基于视觉语言模型的印章识别方法、设备、介质和产品,涉及金融科技领域以及大模型在金融科技领域的应用。该方法通过确定待识别图像内的多个印章图像块,对多个印章图像块进行特征提取,基于提取到的特征,确定对应的印章候选框,确定该印章候选框的类型信息以及提示词;进而将提示词以及多个印章图像块输入至视觉语言模型中,得到每个印章候选框对应的印章识别结果;该方法基于提取到的特征确定对应的印章候选框,且基于视觉信息和语言信息,来共同对印章进行识别,确保了印章识别准确度,也显著提升了金融场景中微小、模糊、遮挡或复杂背景下印章的检测和识别精度,解决了现有技术中存在的小目标信息丢失的难题。
技术关键词
图像块 印章识别方法 计算机执行指令 视觉 印章识别装置 语言分析 可读存储介质 金融 计算机程序产品 识别设备 处理器通信 原型 图像分割 存储器 坐标 模块