关灯
护眼
字体:

三区间估计与标准误(第1页)

章节目录保存书签

三、区间估计与标准误

(一)区间估计的定义

区间估计(iion)就是根据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的一段距离表示未知参数可能落入的范围,它虽不具体指出总体参数等于什么,但能指出未知总体参数落入某一区间的概率有多大。区间估计在点估计的基础上,不仅给出一个估计的范围,使总体参数包含在这个范围之内,而且还能给出估计精度并说明估计结果的有把握的程度。

(二)置信区间与显著性水平

置信区间,也称置信间距(terval,CI),是指在某一置信度时,总体参数所在的区域距离或区域长度。置信区间的上下二端点值称为置信界限(celimits)。显著性水平(significelevel)是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。有时,也称之为意义阶段、信任系数等。1-α为置信度或置信水平(celevel)。

例如0。95置信区间是指总体参数落在该区间之内,估计正确的概率为95%,而出现错误的概率为5%(α=0。05),由此可见:

0。95置信区间=0。05显著性水平的置信区间。

0。99置信区间=0。01显著性水平的置信区间。

显著性水平在假设检验中,还指拒绝虚无假设时可能出现的犯错误的概率水平。

(三)区间估计的原理与标准误

区间估计是根据样本分布理论,用样本分布的标准误(SE)计算区间长度,解释总体参数落入某置信区间可能的概率。

区间估计存在成功估计的概率大小及估计范围大小两个问题。人们在解决实际问题时,总希望估计值的范围小一点,成功的概率大一些。但在样本容量一定的情况下,这两个要求是一对矛盾。如果想使估计正确的概率加大,势必要将置信区间加长,就像在百分制的测验中,估计一个人的得分可能为0至100分之间就绝对正确一样。反之,如果要使估计的区间变小,那就会降低正确估计的概率。

统计分析中一般采取一种妥协办法:在保证置信度的前提下,尽可能提高精确度。规定正确估计的概率,即置信度为0。95或0。99,那么显著性水平则为0。05或0。01,这是依据0。05或0。01属于小概率事件,而小概率事件在一次抽样中是不可能出现的原理规定的。α=0。01表示反复抽样1000次,则得到的1000个区间中不包含参数真值的仅为10个左右。0。05水平和0。01水平也是人们习惯上常用的两个显著性水平。

区间估计的原理是样本分布理论。在计算区间估计值,解释估计的正确概率时,依据的是该样本统计量的分布规律及样本分布的标准误(SE)。也就是说,只有知道了样本统计量的分布规律和样本统计量分布的标准误才能计算总体参数可能落入的区间长度,并对区间估计的概率进行解释,可见标准误及样本分布对于总体参数的区间估计是十分重要的。样本分布可提供概率解释,而标准误的大小决定区间估计的长度。一般情况下,加大样本容量可使标准误变小。

下面以平均数的区间估计为例,说明如何根据平均数的样本分布及平均数分布的标准误,计算置信区间和解释成功估计的概率:

图7-1分布的概率

图7-2μ的区间估计

图7-3置信度示意图

其他总体参数的估计原理与平均数的估计原理相同,但所依据的样本分布及标准误不同。

章节目录