三方差与标准差(第2页)
表4-1分组数据计算标准差和方差
将∑fd2、∑fd、N、i代入公式4-12
计算得到的标准差为s=7。113。这个数值与根据【例2-2】中的原始数据计算的标准差s=6。99,略有出入。主要原因是由于归组效应造成的。
(三)总标准差的合成
由于方差具有可加性特点,在已知几个小组的方差或标准差的情况下,可以计算出几个小组联合在一起的总的方差或标准差。这种计算常在科研协作中应用,例如先了解各班学生情况,再了解全年级情况;或先了解各年级情况,再了解全校总的情况。在教育与心理的科研工作中,经常合成各实验点的资料,也会牵涉方差或标准差的合成。需要注意的是,只有在应用同一种观测手段,测量的是同一个特质,只是样本不同时,才能应用下面的公式合成方差和标准差。计算总方差和总标准差的公式如下:
si为各小组标准差;
Ni为各小组数据个数;
【例4-4】在三个班级进行某项能力研究,三个班测查结果的平均数和标准差分别如下,求三个班的总标准差。
解:利用公式4-14
∑Ni=42+36+50=128
③计算sT
答:三个样本组的总标准sT是16。15。
【资料卡4-1】
差异量数图示
下表中是为了说明离差平方和、方差、标准差之间关系模拟的一组数据:
从表中的数据计算得到离差平方和(sumofdeviationsquare或sumofsquare,SS)∑x2为88,也称为均方和;离差平方和的平均数,即样本方差(variance),也被称为均方(meansquare,MS)的s2是12。57;均方的方根或称均方根差(rootmeaion)为s=3。55,就是上表中的标准差。下图是对s2,s,x,∑x2等概念间的相互关系的一个图示说明。
在这个图解的第Ⅰ部分,坐标轴上以平均数为参考点,标记了7个被试原始分数的离均差。它以距参考点的直线距离来表示,与上表中第三列的数值一致。离均差的平方以各个正方形的面积来表示,对应的是表中第四列的数字。均方和(SS)以所有正方形面积的总和来表示,它包含88个单位面积,每一个单位面积等于图中被试③或被试⑤标记的正方形面积的大小。图中第Ⅱ部分表示的是这组数据的方差与标准差。方差用单个正方形来表示,大小为第Ⅰ部分所有正方形总面积除以7的结果。正方形的边长就是标准差。
(四)方差与标准差的性质和意义
1。性质
方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。统计实践中常利用方差的可加性去分解和确定属于不同来源的变异性(如组内、组间等),并进一步说明各种变异对总结果的影响,是以后统计推论中最常用的统计特征数。
标准差是一组数据方差的平方根,它不可以进行代数计算,但有以下特性。
(1)每一个观测值都加一个相同常数C之后,计算得到的标准差等于原标准差。即如果Yi=Xi+C,则有sY=sX。这一性质表明,若一组数据中的每一个数都加上一个相同的常数,则这组数据彼此的离散程度并不改变,而只是数据分布在数轴上以常数为距离做整体平移。
(2)每一个观测值都乘以一个相同的常数C,则所得的标准差等于原标准差乘以这个常数。即若Yi=C×Xi,则有sY=C×sX。
(3)以上两点相结合,每一个观测值都乘以同一个常数C(C≠0),再加一个常数d,所得的标准差等于原标准差乘以这个常数C。即若Yi=C×Xi+d(C为不等于零的常数),则有sY=C×sX。
2。方差与标准差的意义
方差与标准差是表示一组数据离散程度的最好指标。其值越大,说明次数分布的离散程度越大,该组数据较分散;其值越小,说明次数分布的数据比较集中,离散程度越小。它们是统计描述与统计推断分析中最常用的差异量数。在描述统计部分,只需要标准差就足以说明一组数据的离中趋势。
标准差具备一个良好的差异量数应具备的条件:①反应灵敏,每个数据取值的变化,方差或标准差都随之变化;②计算公式严密确定;③容易计算;④适合代数运算;⑤受抽样变动影响小,即不同样本的标准差或方差比较稳定;⑥简单明了,这一点与其他差异量数比较稍有不足,但其意义还是较明白的。