使用方差度量数据波动的优点方差是实际值与期望值之差平方的平均值,用于度量一组数据的偏差程度.但是,为什么会使用与数据期望

1个回答

  • 楼上说的是一个方面.实际上,实际值与数据期望的差的绝对值的均值也可以度量数据波动,在统计上被称为平均偏差,衡量数据波动的统计量还有极差、四分位差等.各种统计量并没有严格意义上的优劣,要根据具体情况来选用.

    之所以经常用方差,除了楼上说的原因,还有一个很重要的原因是,以平方和的形式表示的方差是可导的,公式推导的时候方便一些.平均偏差的表达式由于绝对值的存在,在零点不可导.

    ——————————————————

    采用何种统计量主要取决于数据的分布和统计的目的.平均偏差和方差的一大区别在于对个别偏差较大的值的处理.比如下面两组值:

    A:10 10 10 10 10 10 10 10 10 110

    B:10 50 10 50 10 50 10 50 10 50

    方差:A为1000,B为444

    平均偏差:A为180,B为200

    如果你认为个别异常数据对数据质量影响较大的话,就选用方差;如果你认为正常数据的波动更有意义就选平均偏差.

    其实统计是种很主观的东西,统计量的选择服务于你想要说明的现象.

    现代统计学有一个概念叫“稳健”,就是个别异常值对统计量的影响程度,从这个角度来说,平均偏差比方差稳健.