一种文本检测方法

申请号：CN202411633117

申请日期：2024-11-15

公开号：CN119495088A

公开日期：2025-02-21

类型：发明专利

摘要

一种文本检测方法，其具体步骤如下：S1，建立文本检测模型，文本检测模型包括backbone网络、FPN网络以及三个输出分支，三个输出分支分别为完整分割mask分支、缩小版分割mask分支以及偏移量检测分支；S2，获取原始标签，分解后生成三个分支的标签数据，输入到文本检测模型中进行训练监督；S3，输入字符图像，经过训练后的文本检测模型后，三个分支分别输出完整的语义分割mask、缩小版的语义分割mask以及偏移量图；通过结合完整的语义分割mask和偏移量图计算出完整的语义分割mask中每个像素的“偏移后坐标”；接着利用缩小版的语义分割mask确定完整的语义分割mask中每个像素的“偏移后坐标”落在哪个缩小版实例区域内，将完整的语义分割mask的每个像素归属到对应的文本实例。

技术关键词

文本检测方法文本检测模型分支语义像素点坐标标签字符网络图像采样率短距离包络数据标记矩形关系