7.3. 数据量与学习性能

本文最后更新于 2025年6月4日晚上

数据量与学习性能

在某些情况下，获取大量数据来进行机器学习并得到模型是一个非常有效的提升模型性能的办法。
2001年Banko 和 Brill试图用不同的算法对一些容易混淆的词汇进行分类，他们用数据集训练这些算法，并绘制了学习曲线。学习曲线反映出来对于大部分算法，数据集量的提升都能够改进模型的性能。
假设有一个需要大量参数的学习算法（通常这样的算法能够拟合更加复杂的模型，因此训练误差会很小），在特征充足的条件下，采用更多的数据能够减小过拟合的可能性，那么测试误差会接近于训练误差，测试误差也会很小。

学习笔记 > 机器学习基础课程——吴恩达 > 07. 机器学习系统设计

7.3. 数据量与学习性能

https://l61012345.top/2021/04/22/机器学习——吴恩达/7. 学习系统设计中的实际问题/7.3. 数据量/

作者

Oreki Kigiha

发布于

2021年4月22日

更新于

2025年6月4日

许可协议

7.2. 查准率和召回率上一篇

Lecture 02 传输线模型下一篇