二确定样本容量的方法(第2页)
至于β在事先究竟定为多少合适,并无固定准则。在假设检验中由于主要目的在于检验“差异”,本来无差异而错判为有差异的概率一定要小,或者说拒绝无差假设的把握一定得大,故而α一般规定得很小(0。05或0。01)。对β错误往往并不予重视,不必定得像α那样小,但β增大时,统计检验能力(1-β)降低(见本书第八章),所以β值也不宜定得太大,一般规定为0。10、0。20或0。30的占多数。
当然,如果样本容量已知,α值及其他条件也已确定,则β就是个确定的值了,可以利用公式14-16等计算出来,从而可以对该检验的统计检验力作出评价。
2。比率的估计或检验时样本容量的确定
前面所述关于平均数的估计或检验时确定样本容量的公式,尽管显得复杂,而且不止一种,其实基本公式只有两个:
根据总体标准差是否已知,抽样总体是有限还是无限,假设检验时是样本与总体μ比较还是两个样本比较等不同条件,基本公式SE的计算要有所变化。因而从上述基本公式出发,引出了适用于不同条件下的确定样本容量的公式。
对于比率的估计或检验,同样可以从上面基本公式出发,根据不同条件下比率的标准误SEp公式得出各种条件下确定样本容量的公式。本章第二节已给出了不同情况下比率标准误的公式,对于样本容量的公式就不再一一给出了。
另外,前面所举的确定样本容量公式都是指简单随机抽样而言。无论是平均数还是比率的调查研究,不同的抽样方法,样本分布的标准误有所不同。将分层抽样或阶段抽样的标准误代入上面的两个基本公式,同样可得到分层抽样或阶段抽样时样本容量公式。但是,在实践中为了方便,不管是哪种抽样方法,常常都按简单随机抽样时的公式来计算样本容量。例如,分层抽样时,按道理应该将公式14-8、公式14-9等标准误公式代入到(A)或(B)两个基本公式中,求出样本容量。但在实践中可以按简单随机抽样的样本容量公式直接计算出样本容量,然后再按比例或最佳方式将样本容量分配到各层。这样虽然算出的样本容量比应有的大一些(因为分层抽样的标准误比简单随机抽样的标准误小),但做起来很方便,尤其是简单随机抽样的样本容量不但可以用公式计算,还有现成的表可供查用。
(二)查表确定样本容量
本书附有不同统计量的简单随机抽样的样本容量确定表,在实际进行抽样调查研究时可直接根据不同条件查出应该抽取的样本容量,非常方便,下面分别举例介绍。
1。有关平均数的抽样研究
(1)由样本平均数估计总体平均数时的样本容量
这时可查附表20,只要确定了α并算出sd,即可在表中找到相对应的样本容量n。表中左边纵列为sd的整数值,上面横行为sd值的一位小数值。例如在α=0。05时,sd=7。4,则从附表20-A中可查到与sd=7。4对应的值是213,这就是所求的样本容量。
在本节【例14-3】中,d=0。5,s=3,α=0。05
即sd=30。5=6。0
在附表20-A中查得n=141
在【例14-3】的计算结果n=140,可见查表的结果与用公式计算的结果出入很小。
(2)两个样本平均数进行差异显著性检验时的样本容量
这时可查附表22(A~E),查表时先求δs值,然后根据单、双侧不同α值及(1-β)值找出对应的样本容量n,注意查得的n与前面用公式算得n意义相同,表示两个样本各自应该具有的容量,即n=n1=n2。
在本节【例14-5】中,δ=10,sp=14。3
双侧检验α=0。05,β=0。20,(1-β)=0。80
查附表22-C
(1-β)=0。80与δs=0。70相交处为33。
即n=n1=n2=33
与公式计算结果相同。
(3)样本平均数与总体平均数差异显著性检验时的样本容量
这时仍然利用附表22(A~E),因为样本平均数与总体平均数差异显著性检验和两个样本平均数差异显著性检验之间存在着一定关系。
样本平均数与总体平均数差异检验时样本容量公式为
两个样本平均数之间差异检验时样本容量的公式为
一般两样本平均数差异检验要求方差齐性,可以认为sp≈s1≈s2(这时sp可用s表示),那么在其他条件都相同的情况下,公式14-21除以2即为公式14-16,也就是说,样本平均数与总体平均数差异检验时确定样本容量仍查附表22(A~E),将查得的结果除以2即可。
例如在本节【例14-4】中:
单侧检验α=0。01,β=0。10,(1-β)=0。90
查附表22-D得164
1642=82即所需样本容量。
与【例14-4】中用公式计算的结果基本一致。
2。有关比率的抽样研究
(1)由样本比率估计总体比率时的样本容量