总体——所要考察对象的全体叫做总体.
个体——总体中每一个考察对象叫做个体.
样本——从总体中所抽取的一部分个体叫做总体的一个样本.
样本容量——样本中个体的数目叫做样本容量.
为了加深对上述概念的理解和分辨能力,我们举以下几例.
例1 为了分析研究某校高中一年级学生的身高情况,从全部高中一年级学生中抽取了50名学生的身高.在这个问题中,总体、个体、样本、样本容量各指什么?
答:本题的总体是指高中一年级学生身高的全体;本题的个体是指高中一年级每个学生的身高;本题的样本是指被抽取的50名学生的身高;本题的样本容量是指50.
在回答上面的问题时,有些同学把总体看成是高中一年级全体学生,这是错误的.应当注意区分具体对象和对象的数量指标.我们要研究的不是这些对象本身,而是它的某种指标,本题的总体应是高中一年级学生身高的全体.
另外,在本题中,样本指的是被抽取的50名学生的身高,而不是50名学生.
总体是一个确定的数字集合,而样本可以有许多.“在总体中取出的一部分个体叫做总体的一个样本”.如果取出另一部分个体那就构成另一个样本,即,使每次抽取身高做为样本的学生都是50人,每次抽取的情况也不会相同.所以样本里面的数都是一些变量,这些变量的特点只有在一次具体的抽取完成之后才能知道它们的值.
从上述分析可以看出,样本一般不等于总体,但样本来源于总体,因而有可能用样本估计总体,这是统计的基本思想.
例2 一个工厂用两种不同的工艺生产同一型号的电脑,现在要测试这种电脑的使用寿命,从两种不同的工艺生产品中各取出20台电脑进行测试.在本题中,总体、个体、样本、样本容量各指什么?
答:总体指的是用第一种工艺生产的电脑使用寿命的全体和用第二种工艺生产的同一型号的电脑使用寿命全体;
个体指的是用第一种工艺生产的每一台电脑的使用寿命和用第二种工艺生产的同一型号的每一台电脑的使用寿命;
样本指的是从用第一种工艺生产的电脑中抽取的20台电脑的使用寿命,和从用第二种工艺生产的同一型号的电脑中抽取的20台电脑的使用寿命.
样本容量分别为20.
在这个问题中,不能把这两种工艺生产的同一型号的电脑放在一起,把它们的使用寿命放在一起看成一个整体.如果这样,总体就变成了两种不同性质的个体的混合物,这是不允许的.所以应当把每一种工艺生产的全部电脑的使用寿命分别看成一个总体.这样,在本题中就有两个总体.有时,在一个问题中,可能有三个、四个、……、总体.
由例1所述,一个总体可以有许多样本,样本的作用主要是对一个总体的某些特征值进行估计或检验,如果样本容量越大,样本对总体的估计就越精确,一个问题里如果有两个总体,那就必须在每个总体中各抽取一个样本,一般情况下,这两个样本容量应当相同,其目的是为了对这两个总体的某些特征值进行比较.