6.2. 方差与偏差

本文最后更新于 2025年6月4日晚上

方差和偏差

判断方法

运行一个学习算法时，如果模型表现不理想，有高可能性是发生了欠拟合（高偏差（Bias））或者过拟合（高方差（Variance））问题。那么如何判断算法究竟出现了哪一种问题？
上一讲中已经定义过训练，测试和验证误差。通常情况下，假设多项式模型中多项式的次数与训练和测试、验证误差的关系如下图所示：

通过上图能够判断模型到底出现了欠拟合还是过拟合： 如果训练和测试误差都很高，那么有高概率是发生了欠拟合问题。 如果训练误差低，测试误差高（远大于训练误差），那么有高概率发生了过拟合问题。

偏差和方差与正则化算法

假设已经得到了一个\(d=4\)的多项式模型： \[h_θ(x)=θ_0+θ_1x+θ_2x^2+θ_3x^3+θ_4x^4\] 对其代价函数增加一个正则化项使得参数尽量缩小:
\[ J_{\theta}=\frac{1}{2m}[\Sigma_{i=1}^{m}(h_θ(x^{(i)})-y^{(i)})^2+λ\Sigma_{j=1}^{m}\theta_j^2]\]

下图表示了正则化系数\(λ\)的大小与拟合情况的关系：

过大的\(λ\)容易发生欠拟合问题，而过小的\(λ\)（近似于\(λ=0\)）则无法起到规避过拟合的作用。
如何设置合适的\(λ\)呢？通过正则化的代价函数\(J(θ)\)求出最合适的一组\(θ\)，此时模型的训练误差\(J_{train}(θ)\)应当不包含正则化项，也就是： \[J_{train}(\theta)=\frac{1}{2m}\sum_{i=1}^{m}(h_θ(x^{(i)})-y^{(i)})^2\]
在加入正则化算法后，测试一系列的\(λ\)的值，并得到一系列最优化的代价函数，并求到一系列的\(Θ\),再用验证集计算验证集误差\(J_{cv}(θ)\),最终选择验证集误差最小的那一组\(θ\),使用测试集计算出测试误差\(J_{test}\)。
下图表示了\(λ\)的大小与训练误差和验证误差的关系：

学习笔记 > 机器学习基础课程——吴恩达 > 06. 诊断与调试

6.2. 方差与偏差

https://l61012345.top/2021/04/22/机器学习——吴恩达/6. 诊断与调试/6.2. 方差和偏差/

作者

Oreki Kigiha

发布于

2021年4月22日

更新于

2025年6月4日

许可协议

6.1. 性能评估上一篇

6.3. 学习曲线下一篇