摘要
一种文本检测方法,其具体步骤如下:S1,建立文本检测模型,文本检测模型包括backbone网络、FPN网络以及三个输出分支,三个输出分支分别为完整分割mask分支、缩小版分割mask分支以及偏移量检测分支;S2,获取原始标签,分解后生成三个分支的标签数据,输入到文本检测模型中进行训练监督;S3,输入字符图像,经过训练后的文本检测模型后,三个分支分别输出完整的语义分割mask、缩小版的语义分割mask以及偏移量图;通过结合完整的语义分割mask和偏移量图计算出完整的语义分割mask中每个像素的“偏移后坐标”;接着利用缩小版的语义分割mask确定完整的语义分割mask中每个像素的“偏移后坐标”落在哪个缩小版实例区域内,将完整的语义分割mask的每个像素归属到对应的文本实例。