机器学习笔记 - Ocr识别中的文本检测EAST网络概述
一、文本检测
文本检测简单来说就是找到图像中可以出现文本的区域。例如,请参见下图,其中在检测到的文本周围绘制了绿色边框。
在进行文本检测时,你可能会遇到两种情况
-
具有结构化文本的图像:这是指具有干净/均匀背景和常规字体的图像。文本大多密集,行结构正确,文本颜色均匀。
-
带有非结构化文本的图像:这是指复杂背景上带有稀疏文本的图像。文本可以具有不同的颜色、大小、字体和方向,并且可以出现在图像中的任何位置。对这些图像执行文本检测称为场景文本检测。
上述两种情况中哪一种看起来更具挑战性。显然,由于如上所述的各种复杂性,答案将是场景文本检测。这就是为什么这是计算机视觉领域的一个活跃研究课题。
1、文本检测器(EAST)
在文本检测领域引入深度学习之前,大多数文本分割方法很难在具有挑战性的场景中执行。传统方法使用手动设计的特