14.3. 文字分离·字符识别

本文最后更新于 2024年1月27日 下午

文字分离·字符识别

照片OCR系统的流水线:

本节将着重于“Character segmentation”文字分离和“Character recognition”字符识别的部分。
这一部分需要再次应用监督学习算法制作分类器。

文字分离

构建数据集

文字分离的数据集同样由正样本和负样本组成,其中正样本是图像中有两个字符分割线的图像,负样本是没有字符分割线的图像。负样本由单个的字符图像和没有字符的图像组成。

滑动窗口

同样地,对每一个上一步文字检测中检测到的区域,应用滑动窗口分类器检测字符分割线的位置。

算法会在识别到分割线的位置对图像进行分割。

字符识别

分割好的图像会传入一个用于识别字符的监督学习多元分类器,从而对字符进行识别。


14.3. 文字分离·字符识别
https://l61012345.top/2021/08/26/机器学习——吴恩达/14. 机器学习实例:OCR/14.3. 文字分离/
作者
Oreki Kigiha
发布于
2021年8月26日
更新于
2024年1月27日
许可协议