14.3. 文字分离·字符识别
本文最后更新于 2024年1月27日 下午
文字分离·字符识别
照片OCR系统的流水线:
本节将着重于“Character segmentation”文字分离和“Character
recognition”字符识别的部分。
这一部分需要再次应用监督学习算法制作分类器。
文字分离
构建数据集
文字分离的数据集同样由正样本和负样本组成,其中正样本是图像中有两个字符分割线的图像,负样本是没有字符分割线的图像。负样本由单个的字符图像和没有字符的图像组成。
滑动窗口
同样地,对每一个上一步文字检测中检测到的区域,应用滑动窗口分类器检测字符分割线的位置。
算法会在识别到分割线的位置对图像进行分割。
字符识别
分割好的图像会传入一个用于识别字符的监督学习多元分类器,从而对字符进行识别。
14.3. 文字分离·字符识别
https://l61012345.top/2021/08/26/机器学习——吴恩达/14. 机器学习实例:OCR/14.3. 文字分离/