14.3. 文字分离·字符识别

本文最后更新于 2023年12月19日中午

文字分离·字符识别

照片OCR系统的流水线：

本节将着重于“Character segmentation”文字分离和“Character recognition”字符识别的部分。
这一部分需要再次应用监督学习算法制作分类器。

文字分离的数据集同样由正样本和负样本组成，其中正样本是图像中有两个字符分割线的图像，负样本是没有字符分割线的图像。负样本由单个的字符图像和没有字符的图像组成。

同样地，对每一个上一步文字检测中检测到的区域，应用滑动窗口分类器检测字符分割线的位置。

算法会在识别到分割线的位置对图像进行分割。

分割好的图像会传入一个用于识别字符的监督学习多元分类器，从而对字符进行识别。

学习笔记 > 机器学习基础课程——吴恩达 > 14. 机器学习实例：光学字符识别（OCR）

14.3. 文字分离·字符识别

https://l61012345.top/2021/08/26/机器学习——吴恩达/14. 机器学习实例：OCR/14.3. 文字分离/

作者

Oreki Kigiha

发布于

2021年8月26日

更新于

2023年12月19日

许可协议