关灯
护眼
字体:

2 抽样调查 以偏概全就免谈公正客观(第1页)

章节目录保存书签

2抽样调查:以偏概全就免谈公正客观

这位家有女儿的妈妈真是着急。女儿年方20,做妈的已经数次去过人民公园,就是传说中上海最牛的“相亲大市场”。那里人山人海,到处挂满制作精良的儿女广告,而且一眼望去女性的广告要远远多于男性,据非官方统计约为七八比一,更有危言耸听的说是十比一。她们的父母躲在树阴下,只要见有人对他们的广告感兴趣便羞答答地前来搭话。看得这位没经验的妈妈心里一抽一紧的,那些挂出来的女儿们都有好学历、好工作、好收入,不晓得为什么还要逼得父母出如此下策。

——摘自某公开报道

从新闻学角度看,这是一篇典型的新闻调查;可是从统计学角度看,这就是一篇典型的抽样调查了。相信读者经常读到这类报道,并且读得津津有味,可是殊不知,从统计学角度看,这类报道难免以偏概全。

这篇报道的本意是,在上海,有女儿的家庭向来非常骄傲,这不但因为上海地区没有重男轻女习惯;而且将来嫁女儿要比娶媳妇开销少很多,父母在经济上没有后顾之忧;更不用说,女儿出嫁后依然可以名正言顺地做父母的“贴身小棉袄”,还会捎带着女婿一起做,十分“实惠”。可是现在形势不同了,越是好学历、好收入、好工作的女儿就越难找对象,以致于出现许多30多岁依然未婚的“剩女”,让她们的父母急白了头,不得不亲自出马到上海人民公园去“越位”相亲。

事情果然如此吗?你可以相信,因为这种情形确实存在;但也可以不信,因为这种情形并不普遍,与其说是普例不如说是个例。更何况这种情形并不是上海特有,全国大中城市大同小异。

在上海人民广场,一则父母代女征婚启事是这样写的:“女儿197×年生,浦东一外企技术人员,月薪4000元以上……要求男方年薪10万以上,自备无房贷婚房。女儿不会做家务,热爱旅游,男方应当承担家务或另请保姆。”

可以说,无论这位女儿是否属于“好学历、好收入、好工作”之列,从恋爱、婚姻角度看,她其实并不适合结婚,也难怪剩到现在。

回到我们抽样调查的话题上来。所谓抽样调查,是指从研究对象总体(也叫母体)中抽取一部分个体(也叫元素)做样本进行调查,从中推断有关总体的数字特征。通俗地说就是,在全部研究对象中抽取一部分具有代表性的个体对象进行研究,然后反推总体数据是多少。

容易看出,抽样调查是一种非全面调查,为此,为了保证抽样调查结果能代表总体、能推断总体,必须首先确保这部分被调查个体的代表性。如果能很好地做到这一点,那么尽管抽样调查得到的结果与真实情况之间存在误差,这种误差也是可以允许的,并且能够控制在合理范围内。因为既然是对一部分个体进行调查,就不可避免地会出现误差,问题是这种误差应当合理。

以上面这则报道为例,记者当然可以把大龄未婚青年作为一个群体,然后在恋爱、婚姻方面进行抽样调查,但应当注意这个群体本身也是“个体”,而不是全体未婚女青年的“总体”。虽然这个群体也可以作为“总体”,但如果是这样,在作出调查结论时就必须特别注明是怎样的一个范围,以免读者在潜意识中把全体未婚女青年当做总体来看待。并且在进行这种“抽样”时要根据统计方法进行,避免以偏概全。

实际上,现实生活中类似这样的“抽样调查”非常多。可以说,这种调查一开始就注定它的结果不会十分客观、公正。

多年以前,国内总流传着外国人夸中国人(实际上是中国留学生)如何聪明的说法,这实际上就是一种不合理的抽样调查得到的结果。

例如,一位德国教授在加拿大担任客座教授期间,惊讶地发现外国留学生尤其是来自中国内地、中国香港的留学生要比加拿大学生表现得更聪明、好学,成绩也更优秀。以他的讲座为例,当加拿大学生中有13课程不及格时,这些中国留学生没有一个不及格的。

由此他得出一个结论:从统计学角度看,亚洲人或许是“比较聪明”的。然而他很快就推翻了这一结论。因为事实证明,这些中国内地、香港来的留学生,父母之所以把他们送到加拿大来读书,是因为他们在兄弟姐妹中算是“比较聪明”的,否则就不会送来了。现在要把这种优秀学生群体和加拿大普通学生群体对比,本身就没有可比性,他们不能代表全体中国内地、香港学生的平均水平。

那么,上述这种以偏概全为什么在新闻报道中会非常普遍呢?原因有二:一是新闻报道本身追求轰动效应、夸张效果,二是这些记者根本就不懂统计调查究竟应当如何进行。

例如,有媒体报道说,某省消费者委员会的抽样调查显示,“高达84%的超市熟食细菌超标,一些腐烂变质的食品也赫然出现在许多超市货架上,超市食品卫生状况令人担忧。”并由此得出“购买超市食品应注意卫生质量,慎防病从口入”的结论 1。

事实果真如此吗?读者在这里就必须关注这种抽样调查是如何进行的。如果事情果然这样,那就可以断定,超市销售的熟食卫生状况太可怕,这时候应该实行行业停业整顿,而不是仅仅提醒消费者“擦亮眼睛”就行。试想,消费者购买的熟食卫生质量达标率只有15了,这时候再“擦亮眼睛”也不可能“慎防病从口入”的。

抽样调查为什么可行?其前提条件是,有些统计调查对象非常广泛而庞大,而且同质性强,实在没必要、更多时候是不可能对所有研究对象进行全面调查,所以只好用抽样调查来替代。

这时候只要抽样调查的方法科学、样本具有很好代表性,这种方法就不但省钱、省时、省力,而且准确性高,同样能达到全面调查的目的。正因如此,有相当多的统计数据是通过抽样调查得到的。

有则经典笑话说,妈妈叫孩子去买一盒火柴,并且嘱咐他一定要试试是不是好用。孩子回家后高兴地对妈妈说,我买的这盒火柴很好用,我都一根根试过了。

这则故事之所以好笑,在于妈妈本来是要孩子划几根火柴试试,看看火柴的质量如何;而孩子由于年龄小,没听懂妈妈的真实意图,便自以为是地每一根都试了试。

在这里,孩子实际上并不知道检查这盒火柴质量好坏不需要进行全面调查、只要用抽样调查进行推断就行了。

再例如,我国有13。4亿人口,要了解全国人口详细数据,当然可以进行一次广泛而深入的人口普查,但这种调查牵涉面广、财力投入大、耗费精力多、时间长,如果不是要求十分精确,就可以通过抽样调查推算出相关数据来。全国1%的人口抽样调查就是其中之一。虽然这种抽样调查得到的结果不是100%精确,但基本上能达到调查目的。

抽样调查与全面调查之间必然存在误差,这种误差主要有两种:

一是工作误差。工作误差也叫登记误差或调查误差。工作误差虽然不可原谅,但却很难避免。与全面调查相比,抽样调查的研究对象少、代表性强、所需调查人员少,所以抽样调查的工作误差比全面调查小。特别是在总体包含调查对象较多的情况下,抽样调查得到的结果其准确性还会高于全面调查。

二是代表性误差。代表性误差也叫抽样误差。由于抽样调查是在总体中抽取一部分样本进行的,所以无论这种样本的代表性有多高,都不可能完全代表总体,两者之间总会有误差。为了尽可能减少误差,一般要求通过科学的调查设计把这种误差控制在允许范围内。

那么,怎样进行这种科学的调查设计呢?这主要包括:

一是抽样调查的样本必须是随机的,这除了能保证被抽取的样本在总体中均匀分布外,还能有效避免倾向性误差。

章节目录