14.1. 问题背景与框架设计

本文最后更新于 2024年1月27日 下午

问题背景与框架设计

本章以光学字符识别技术为实例,介绍一个机器学习系统是如何被组装起来的,以及设计机器学习系统的路线。

问题背景

照片光学字符识别(Photo OCR),顾名思义,即机器学习能够自动识别照片当中包含的文字。对于给定的照片,算法会全局扫描照片,然后找出照片中的文字信息。在找出这些信息后,算法会对这些文字进行识别。

框架设计·流水线

一个照片光学字符识别系统的框架设计流水线(Pipline)如下:
1. 文字检测
全局扫描照片,找出照片中可能是文字信息的部分。
2. 文字分离(Character segmentation)
对这些文字信息的部分,将这些文字信息分割成一个个独立字符的区域。

3. 字符分类
对每个独立的字符区域进行识别。

在机器学习系统设计中,用流水线的形式来表示机器学习系统的每一个组成部分的形式非常常见,这些组成部分可能是一些部分独立的机器学习组件能够被拆分直接调用。
使用这样的流水线的另一个优势是在构建机器学习系统时能够快速地分配人员和开发资源,一些相互独立的部分也可以同时进行开发,加快开发速度。


14.1. 问题背景与框架设计
https://l61012345.top/2021/08/24/机器学习——吴恩达/14. 机器学习实例:OCR/14.1. 框架设计/
作者
Oreki Kigiha
发布于
2021年8月24日
更新于
2024年1月27日
许可协议