34 被统计 扭曲数据真实性的哈哈镜(第1页)
34被统计:扭曲数据真实性的哈哈镜
在经历了“晒衣”“晒食”“晒就业”“晒股票”后,上周以来,网友们掀起新一轮的“晒工资”热潮。与以往不同的是,此次的“晒工资”热潮却是因为国家统计局的一项统计数据引发的,很多人觉得大众的工资水平被统计局算高了,网友们诙谐地将之称为工资“被增长”。
——摘自某公开报道
2009年7月28日,就在国家统计局发布“2009年上半年中国城镇居民人均可支配收入8856元,同比增长9。8%,扣除价格因素实际增长11。2%;上半年中国城镇和农村居民收入增长幅度均超过GDP增长幅度”数据的第二天,一位名叫夏余才的网友在个人博客中率先使用了“被增长”一词。意思是说,他的实际收入虽然并没有增长,但在统计数据中却被增长了,从而使得自己被统计数据“幸福地”笼罩着 1。
这种感受很快得到大多数人认同,于是“被增长”一词迅速传播开来,并带动产生了一大批诸如“被自杀”“被就业”“被小康”“被统计”等热门名词。有人甚至惊呼,中国由此进入“被时代”,各大网站纷纷对此展开热烈讨论。
平心而论,只要一谈到“被”字,就表明这是弱势的一方——他们无法发出自己的声音,甚至连定义权也只能由掌权的另一方拿着,任人摆布。他们是“被迫”的,是无奈的,有一种被强奸民意的感觉。
例如,2009年8月12日国家教育部推出《通用规范汉字表》向全社会公开征求意见后,就出现了一例“被统计”案例。
国家教育部推出这份征求意见稿,提出在恢复51个异体字的同时,拟对44个汉字进行“动刀整形”(即调整写法)。结果没想到,这一据说是“历时8年”“经过专家全盘考虑,反复研究才得以出台”的局部性汉字技术改良方案,遭到全社会一片反对。
大型门户网站的在线调查表明,在389345人参加的投票中,选择反对的占90。4%,选择支持的只占5。0%,几乎呈一边倒趋势 2。
就在这种背景下,国家教育部网站推出的一篇文章中提到,在过去的9天中他们接到通过信函、传真、电子邮件等方式的将近1500条建议和意见,其中67%持“赞成”态度,认为字形调整是必要的;“反对”意见只有6% 3。
消息刊出后,许多公众笑称自己和这44个汉字都“被统计”(被赞成)了。因为无论如何,即使这1500人的意见是真实的,国家教育部也不该只看这些人的意见而忽略了另外38。9万人的大多数意见。但事情明摆着,无论公众如何表达反对意见,都没有话语权。
但随后传出的消息颇具戏剧性。国家教育部公开辟谣说,“67%的公众支持汉字字形调整”的消息是媒体误读,称它们得到的统计数据也是绝大多数公众反对汉字微调的,和网上的调查数据相吻合 4。
这下子公众更糊涂了,不知道究竟谁是谁非。但由此得出一个结论,那就是统计样本不全导致的统计数据一定不真实。那么相反,能不能说统计样本越大越好呢?当然也不是。因为任何统计调查都有它的特定目的,是统计目的决定统计样本大小,不必过大也不能过小,否则容易走向另一个极端。
例如,在2009年9月20日沈阳举行的一场报告会上,北京师范大学房地产研究中心的一位著名专家认为,我国的房地产价格根本就不高,根本就不该和外国比。因为我国的房价中并没有统计农村住房和单位集资建房在内,如果把这些也算进去,我国的房价其实是很低的 5。
这话听起来确实有道理。那么这是否能说明,我国农民的住房和单位集资建房没有“被统计”在内就错了呢?在这里,这位专家实际上就犯了两个错误:
一是我国的农民住房并不是商品房,所以根本就不能和城市商品住宅混在一起计算价格,否则得到的就不是“商品房”价格数据了。事实上,哪怕农村住房的价格再低,城市居民也是买不到的,或者说这种买卖是非法的。
二是国外没有城乡二元制度,也没有专门针对农民的歧视政策,所以根本就没有“城”“乡”之别,这和城乡有着天壤之别的我国现实完全不符,所以不能进行这种比较。
同样的道理,单位集资建房和廉租房的产权也不能进入房地产市场交易,所以根本就“没有”市场价格,这又怎么能混杂在商品住宅中一起进行商品房价格计算呢?
看来,农村住宅和单位集资建房没有“被统计”在商品房价格内是对的,公众不必犯这种把不是商品房也混淆为商品房的概念错误。
每年我国职工平均工资数据一公布,就会遭到一片骂声,也是这个道理。因为即使你的工资水平没有提高甚至在下降,可由于整个社会上总有一部分人的工资收入是不断增加的,所以这时候全国的职工平均工资数据一定是在增加的。换句话说,你的工资收入水平已经不得不“被增长”了。
除了统计数据的被统计外,统计范围的被统计也是非常容易忽悠人的。例如在职工平均工资收入统计中,目前的统计制度规定不包括私营企业、个体工商户从业人员数据(这部分人的工资收入通常较低),从而使得绝大多数职工平均工资没有统计数据所称的平均收入高。那么这部分人有多少呢?具体数据是:我国城镇在岗职工一共3亿人,纳入统计口径的只有1。3亿人,将近60%的员工没有被统计在内 6。
不过话说回来,这并不全是统计部门的错。因为现行统计制度规定,职工平均工资是指企业、事业、机关单位职工在一定时间内平均每人所得到的工资额,包括基本工资、奖金、津贴、补贴、加班工资,以及单位从个人工资中代扣代缴的养老、失业、医疗、住房公积金等在内,并且还是税前工资;并且统计制度规定,城镇单位在岗职工工资统计范围,仅仅包括国有单位、城镇集体单位以及联营经济、股份制经济、外商投资经济、港澳台投资经济单位,不包括城镇私营企业和个体工商户。说到底,这还是过去计划经济时代的“遗产”。
不过国家统计局表示,我国已经从2009年起建立年度私营单位工资统计抽样调查制度,把私营企业也纳入人均工资统计调查范围,以便使得全国职工平均工资数据更符合实际。并且从2010年起,每年公布一次全国职工平均工资收入,不再发布季度数据。
国家统计局2009年10月27日公布的数据表明,2008年末全国城镇私营单位从业人员约有6676万人,相当于当时劳动工资统计制度所包括从业人员的54。75%;2008年全国城镇私营单位从业人员的平均工资为17071元,相当于当时劳动工资统计制度平均工资数据的58。4% 7。
“被统计”现象和“不被统计”现象两者并存,是外国人不太愿意相信我国统计数据的原因之一。
例如,我国统计部门得到的对美贸易顺差,要比美国统计部门得到的对中贸易逆差高出40%,而按理说这两个数据应该是一致的,至少也相差不大。2003年1月到9月,根据我国统计得到的数据是,我国对美国的贸易顺差为420亿美元;而根据美国统计得到的数据是,1月到8月美国对我国的贸易逆差为770亿美元 8。
两者数据之所以相差这么大,除了我国统计数据中不包括经停港澳的转口贸易、美国统计数据中采用的是原产地统计方式 9外,也不排除有部分“被统计”因素在内。
不但外国人如此,即使中国人自己也经常会对统计部门公布的数据产生怀疑。香港凤凰卫视记者吴小莉在节目中提到,她曾经在中国日报英文版上看到一个统计数据,说中国人对政府发布的统计数据的不信任度,已经从2007年的79%上升到2009年的91% 10。
例如,在统计消费价格指数(CPI)时,统计部门就没有把房价算进去。所以,我国统计数据中出现的消费价格指数总是个位数;而如果把房价因素放进去,那就肯定是两位数。而从社会平均收入的职工买不起住房看,个位数的消费价格指数与公众感受不符。
那为什么不把房价因素考虑进去呢?虽然统计部门有各种解释,但主要原因之一是它们善于搞“被统计”——为了突出“政绩”,有时候会把一些数据给“和谐”掉,而不放到统计样本中去计算。这样得到的统计数据虽然也是“有根有据”的,却由于已经剔除一块统计样本,所以最终和老百姓的实际感受完全不一样。
当然,这种“选择性统计”制度不仅仅局限于统计平均工资数据时,还涉及其他许多方面。
例如,这种手法经常出现在各种排行榜评比中。有一年在计算我国城市竞争力排行榜时,南方某地级市位居排行榜第二位,紧跟在香港之后,比北京、上海的排名更靠前。然而这种数据却是不真实的。
究其原因在于,该市的经济总量是既定的,可是在统计人口基数时依据的是户口人数,大约为170万人;而实际上,该市的长期居住人口为700万人 11。由于不具备该市户口的530万人没有“被统计”在内,所以该市的人均数据轻而易举地就提高了530÷170=3。12倍。当然,其他城市也有这种情形,这就导致整个排行榜数据不可靠;换句话说,据此得到的城市竞争力数据并不符合客观实际。
在各种选择性统计中,最容易被遗忘的是农民和农民工。究其原因在于他们人数多,能够在“被统计”和“不被统计”时拥有更大权重。