分位数是将总体的全部数据按大小顺序排列后,处于各等分位置的变量值.如果将全部数据分成相等的两部分,它就是中位数;如果分成四等分,就是四分位数;八等分就是八分位数等.四分位数也称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括25%的数据,处在各分位点的数值就是四分位数.四分位数有三个,第一个四分位数就是通常所说的四分位数,称为下四分位数,第二个四分位数就是中位数,第三个四分位数称为上四分位数,分别用Q1、Q2、Q3表示.四分位数作为分位数的一种形式,在统计中有着十分重要的作用和意义,现就四分位数的计算做一详细阐述.
一、资料未分组四分位数计算
第一步:确定四分位数的位置.Qi 所在的位置=i(n+1)/4,其中i=1,2,3.n表示资料项数.
第二步:根据第一步四分位数的位置,计算相应四分位数.
例1:某数学补习小组11人年龄(岁)为:17,19,22,24,25,
28,34,35,36,37,38.则三个四分位数的位置分别为:
Q1所在的位置=(11+1)/4=3,Q2所在的位置=2(11+1)/4=6,Q3所在的位置=3(11+1)/4=9.
变量中的第三个、第六个和第九个人的岁数分别为下四分位数、中位数和上四分位数,即:
Q1=22(岁)、Q2=28(岁)、Q3=36(岁)
我们不难发现,在上例中(n+1)恰好是4的整数倍,但在很多实际工作中不一定都是整数倍.这样四分位数的位置就带有小数,需要进一步研究.带有小数的位置与位置前后标志值有一定的关系:四分位数是与该小数相邻的两个整数位置上的标志值的平均数,权数的大小取决于两个整数位置的远近,距离越近,权数越大,距离越远,权数越小,权数之和应等于1.
例2:设有一组经过排序的数据为12,15,17,19,20,23,25,
28,30,33,34,35,36,37,则三个四分位数的位置分别为:
Q1所在的位置=(14+1)/4=3.75,Q2所在的位置=2(14+1)/4=7.5,Q3所在的位置=3(14+1)/4=11.25.
变量中的第3.75项、第7.5项和第11.25项分别为下四分位数、中位数和上四分位数,即:
Q1=0.25×第三项+0.75×第四项=0.25×17+0.75×19=18.5;
Q2=0.5×第七项+0.5×第八项=0.5×25+0.5×28=26.5;
Q3=0.75×第十一项+0.25×第十二项=0.75×34+0.25×35=34.25.
二、资料已整理分组的组距式数列四分位数计算
第一步:向上或向下累计次数(因篇幅限制,以下均采取向上累计次数方式计算);
第二步:根据累计次数确定四分位数的位置:
Q1的位置 = (∑f+1)/4,Q2的位置 = 2(∑f +1)/4,Q3的位置 = 3(∑f +1)/4
式中:∑f表示资料的总次数;
第三步:根据四分位数的位置计算各四分位数(向上累计次数,按照下限公式计算四分位数):
Qi=Li+■×di
式中:Li——Qi所在组的下限,fi——Qi所在组的次数,di——Qi所在组的组距;Qi-1——Qi所在组以前一组的累积次数,∑f——总次数.
例3:某企业工人日产量的分组资料如下:
根据上述资料确定四分位数步骤如下:
(1)向上累计方式获得四分位数位置:
Q1的位置=(∑f +1)/4=(164+1)/4=41.25
Q2的位置=2(∑f +1)/4=2(164+1)/4=82.5
Q3的位置=3(∑f +1)/4=3(164+1)/4=123.75
(2)可知Q1,Q2,Q3分别位于向上累计工人数的第三组、第四组和第五组,日产量四分位数具体为:
Q1=L1+■×d1=70+■×10=72.49(千克)
Q2=L2+■×d2=80+■×10=80.83(千克)
Q3=L3+■×d3=90+■×10=90.96(千克)