楼上说的是一个方面.实际上,实际值与数据期望的差的绝对值的均值也可以度量数据波动,在统计上被称为平均偏差,衡量数据波动的统计量还有极差、四分位差等.各种统计量并没有严格意义上的优劣,要根据具体情况来选用.
之所以经常用方差,除了楼上说的原因,还有一个很重要的原因是,以平方和的形式表示的方差是可导的,公式推导的时候方便一些.平均偏差的表达式由于绝对值的存在,在零点不可导.
——————————————————
采用何种统计量主要取决于数据的分布和统计的目的.平均偏差和方差的一大区别在于对个别偏差较大的值的处理.比如下面两组值:
A:10 10 10 10 10 10 10 10 10 110
B:10 50 10 50 10 50 10 50 10 50
方差:A为1000,B为444
平均偏差:A为180,B为200
如果你认为个别异常数据对数据质量影响较大的话,就选用方差;如果你认为正常数据的波动更有意义就选平均偏差.
其实统计是种很主观的东西,统计量的选择服务于你想要说明的现象.
现代统计学有一个概念叫“稳健”,就是个别异常值对统计量的影响程度,从这个角度来说,平均偏差比方差稳健.