7.3. 数据量与学习性能

本文最后更新于 2024年1月27日 下午

数据量与学习性能

在某些情况下,获取大量数据来进行机器学习并得到模型是一个非常有效的提升模型性能的办法。
2001年Banko 和 Brill试图用不同的算法对一些容易混淆的词汇进行分类,他们用数据集训练这些算法,并绘制了学习曲线。 学习曲线反映出来对于大部分算法,数据集量的提升都能够改进模型的性能。
假设有一个需要大量参数的学习算法(通常这样的算法能够拟合更加复杂的模型,因此训练误差会很小),在特征充足的条件下,采用更多的数据能够减小过拟合的可能性,那么测试误差会接近于训练误差,测试误差也会很小。


7.3. 数据量与学习性能
https://l61012345.top/2021/04/22/机器学习——吴恩达/7. 学习系统设计中的实际问题/7.3. 数据量/
作者
Oreki Kigiha
发布于
2021年4月22日
更新于
2024年1月27日
许可协议