偏差,方差与标准差
太好了!下面是你要的总结性计算方法 + 对比表格,非常适合整理成笔记或用于教学/复习📘
一、计算公式总览
名称 | 计算公式(简化版) | 解释 |
---|
偏差 Bias | $\text{Bias} = \mathbb{E}[\hat{y}] - y$ | 预测值的平均 与 真实值 的差距 |
方差 Variance | $\text{Var}(x) = \frac{1}{n} \sum (x_i - \bar{x})^2$ | 每个数与均值的差的平方的平均 |
标准差 Std Dev | $\sigma = \sqrt{ \frac{1}{n} \sum (x_i - \bar{x})^2 }$ | 方差的平方根,更直观表示离散程度 |
二、核心区别对比表(结合量身高例子)
名称 | 关注点 | 通俗理解 | 现实例子(量身高) | 数值特性 |
---|
偏差 | 准不准 | 距离“正确答案”远不远 | 设备坏了,所有人身高测得都矮10cm | 可正可负,方向性强 |
方差 | 稳不稳 | 多次结果波动大不大 | 同一个人测一会儿150、一会儿190 | 越大波动越大 |
标准差 | 分不分散 | 平 均离均值多远(离散程度) | 多数人集中 vs 多数人很分散 | 恒为非负,更易解释 |
三、量身高案例对比(数据模拟)
数据组 | 数据样例 | 偏差(Bias) | 方差(Variance) | 标准差(Std Dev) | 解读说明 |
---|
真实值 | 170, 172, 168, 171, 169 | - | - | - | 基准数据 |
测量组1 | 170, 172, 168, 171, 169 | 0 | 小 | 小 | 完美准确且稳定 |
测量组2 | 160, 162, 158, 161, 159 | 高(约 -10) | 小 | 小 | 系统性偏差,稳定但不准 |
测量组3 | 150, 190, 140, 200, 160 | 中等 | 高 | 高 | 不稳定,波动大 |