三方差与标准差(第1页)
三、方差与标准差
(一)计算公式
方差(variance),也称变异数、均方。作为样本统计量,用符号s2表示,作为总体参数,用符号σ2表示。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。方差是度量数据分散程度的一个很重要的统计量。它就是前面讲过的动差体系中的二级动差,用二级动差表示全部数据分布的差异度,这种方法消除了平均差不便于代数运算的缺点。
标准差(staion),即方差的平方根,用s或SD表示,若用σ表示,则是指总体的标准差。方差与标准差是最常用的描述次数分布离散程度的差异量数。本章只是讨论样本数据,故方差的符号用s2,标准差的符号用s。计算标准差的基本公式如下:
【例4-3】计算6,5,7,4,6,8这一组数据的方差和标准差。
解:已知X1=6,X2=5,X3=7,X4=4,X5=6,X6=8,N=6
①求平均数
②求离均差的平方和
③代入公式4-7和公式4-8,求方差与标准差
将∑x2、N,代入公式4-7、公式4-8得:
答:这组数据的方差为1。67,标准差为1。29。
运用公式4-7与公式4-8分别求方差与标准差,都要先求平均数,再求离均差。若平均数不一定是一个整数或者有不能除尽的数,那么在计算过程中就会引入计算误差,计算也会很冗繁。此时可以直接使用原始分数计算方差与标准差。公式如下:
式中:∑X2——原始数据的平方和;
(∑X)2——原始数据总和的平方;
N为数据个数。
上面的这两个公式分别与公式4-7与公式4-8是等价的,它源于求方差与标准差的基本公式。有兴趣的读者可利用连加和的法则与平均数的特点的数学表达式推导证明。
【例4-3】中的数据,如果采用公式4-9计算,其步骤如下:
①求原始数据的平方和
②求原始数据的总和∑X=X1+X2+X3+X4+X5+X6=6+5+7+4+6+8=36
③代入公式4-9求方差
将∑X2、∑X、N,代入公式4-9得:
上述结果与公式4-7计算的结果相同。
在计算方差与标准差的这些公式中,公式4-7利用平均数计算,直观容易理解,但平均数是一个导出分数值,当小数位有限制时,方差和标准差容易受平均数的影响而使精度受损。公式4-9则利用了每一个原始分数来计算方差,其精确度更高,可以消除计算误差。这一点需要读者注意。尤其利用计算机时既不怕计算繁复,又可消除计算误差使精确度更高,所以它就是经常使用的最好方法。
(二)计算分组数据的标准差与方差
当数据分组编制成次数分布表后,计算方差与标准差就可用下面的公式:
上面的公式是由计算方差与标准差的基本公式推演而来,其中第二个公式称为组距离差计算法。公式中d=(Xc-AM)i(其中AM为估计平均数,Xc为各分组区间的组中值,i为组距,f为各组区间的次数,N=∑f为总次数)。次数分布的原始数据分别用各分组区间的组中值Xc代表,落入各分组区间数据的总离均差用fx表示。下表(数据来源于表2-3)说明了分组数据求方差与标准差的步骤: