结合文字信息的绘本图像识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
结合文字信息的绘本图像识别方法及系统
申请号:CN202411050263
申请日期:2024-08-01
公开号:CN119068500A
公开日期:2024-12-03
类型:发明专利
摘要
本申请提供了一种结合文字信息的绘本图像识别方法及系统,涉及绘本图像识别领域。该方法包括:获取待识别的绘本图像,并通过OCR对所述待识别的绘本图像中的文字数据进行提取,得到绘本文字数据;对所述待识别的绘本图像进行特征提取,得到图像特征;将所述绘本文字数据和所述图像特征进行融合,得到绘本的多模态表示;将所述绘本的多模态表示与预设的绘本特征库进行比对,得到绘本匹配结果;根据所述绘本匹配结果和所述绘本的多模态表示对所述待识别的绘本图像进行绘本图像识别,得到绘本识别结果。通过上述技术方案提高了绘本图像的识别能力。
技术关键词
图像识别方法 模板特征 多层次特征提取 文本检测模型 图像识别系统 可读存储介质 多尺度 特征提取模块 收发器 数据获取模块 注意力机制 设备通信 电子设备 存储器 匹配模块 处理器 指令 识别模块