关灯
护眼
字体:

32 数据打架 公说公有理婆说婆在行(第1页)

章节目录保存书签

32数据打架:公说公有理,婆说婆在行

俗话说,两虎相争,必有一伤。这话用于“数据打架”无疑会失灵。数据发生争斗,受伤的显然不会是两个数据中的任何一方,而很可能是无辜百姓。因为混乱的统计信息,会干扰政府与公众对信息的判断,影响决策层对民生问题的规划。由于数据的发布完全由调查统计者说了算,因而真假难辨的数据又是对公众知情权的漠视。

——摘自某公开报道

统计数据打架,严格地说并不是统计数据本身在“打”架,而是统计数据的调查、发布者,由于采用的统计手段、统计目的不同,从而导致统计数据相互不一、悬殊过大、漏洞百出甚至自相矛盾。

要了解统计数据为什么会打架,首先要了解我国统计数据都有哪些分类,以及怎么发布的。归根到底,只有不同部门之间发布的统计数据才更可能相互矛盾;同一部门发布的统计数据如果前后不一,这种自毁形象的低级错误,还是较少见的。

总体来看,我国日常发布的统计数据可以分为两大类:一类是统计数据,另一类是管理数据。它们的区别是:统计数据是由国家统计部门发布的,涵盖生产、消费、投资、价格等领域,主要目的是用来反映实体经济;管理数据是由管理部门搜集和发布的,主要目的是加强本行业、本部门管理。

我国统计数据发布的原则是:谁搜集、谁发布。具体地说是,国家统计局发布由全国统计局系统搜集到的数据;国务院其他部门如财政、税务、文化、教育、卫生、科技等部门,分别发布由各部门自己搜集到的数据。

统计数据打架的情形比比皆是。例如,大到国家统计局和国家财政部公布的全年税收数据,小到各地方、各部门公布的楼市数据,统计数据之间互相矛盾、打架甚至数据相差多少倍的情形,不但在所难免,而且可以说司空见惯。

统计数据打架的原因之一,在于调查样本和统计方法不同,从而导致调查结果悬殊过大,甚至相差好多倍。

统计数据打架的背后,有许多耐人寻味的东西。因为谁都知道,统计方法决定着统计数据的来历,而统计方法的选用有许多讲究,最主要的是要根据统计目的而定。

在目前的中国,究竟有多少种统计标准谁也说不清,但通过各种数据打架事件,却能让人隐隐约约了解到其背后的利益诉求。通俗地说就是,生产这些统计数据的人是坐在哪条板凳上、为谁说话的。

例如在房地产价格统计领域,统计房屋价格的方法有“加权法”和“平均法”等,在测算水源质量时有“一票否决法”和“权重法”等。不同的统计方法得到的结果不一样,看上去似乎都有理,但实际上面对的都是“上面”(领导)而不是“下面”(公众),本末倒置了。

例如,广东省某市测算该市2006年的饮用水源达标率高达97。8%,采用的是“权重法”,即如果在28项指标中有1项不合格,就算做128不合格;而广东省环境保护局测算该市的饮用水源达标率只有67。9%,采用的则是“一票否决法”,即如果在这28项指标中有1项不合格,就算做全部不合格。

再例如,广州市国土资源和房屋管理局得到的统计数据是,2007年3月广州市的房屋平均价格比上月有大幅度下降,采用的是“平均法”;而国家发展和改革委员会、国家统计局得到的统计数据是,广州市当月的房屋平均价格比上月有大幅度上升,采用的则是“加权法” 1。

这方面最典型的一则案例是,中国社会科学院2008年12月16日发布的《社会蓝皮书》表明,我国2008年城镇失业率已攀升到9。4%,大大超过国际公认的7%的警戒线。而2009年3月国家人力资源和社会保障部公布的数据表明,我国2008年的城镇登记失业率是4。2%,离7%的警戒线还有一段不小的距离。

显而易见,对于公众来说,这前后相差一倍的两个数据,一个是城镇调查失业率,一个是城镇登记失业率,这两者之间究竟有什么不同很难搞清楚。而实际上,中国社会科学院9。4%的数据是根据实地抽样调查得到的,符合国际惯例,也更接近于现实;而国家人力资源和社会保障部4。2%的城镇登记失业率,是坐在办公室里依据从下往上一级级报表汇总得到的数据,当然离现实有一段距离了 2。

不用说,政府发布的统计数据大多是民生数据,与一般科研数据允许学术探讨的氛围不同。这些民生数据既要回应民意,又要为政府决策担责。所以,公布相关统计数据时要求做到准确、科学、通俗是最基本要求,根本就不能用“1000个读者就有1000个哈姆雷特”这样的艺术逻辑来忽悠公众。

进一步追问:不同统计机构的调查样本和统计方法为什么会不一样呢?这除了观念问题外,还很可能有不可告人的目的在内。

例如,仍然以城镇失业率为例。一个是调查数据,一个是登记数据,即使这两个统计数据都是真实可靠的,数据打架仅仅是方式方法上的不同,那么公众也仍然有理由问,这么多年下来为什么就不能从这两个指标中选一个更理性、更通俗并且与国际接轨的统计手段来一致对外呢?

说穿了还是某种利益在作怪,是权力诉求在博弈。正如全国人大常委会委员朱永新一针见血所说的那样:“统计数据变化莫测,要政绩的时候是一个数字,要补助的时候又是一个数字。” 3

从某种意义上说,统计数据打架比没有统计数据更糟糕。

道理很简单,如果没有这项统计数据,公众可能还不会对此留下什么印象,不致于造成恶劣影响;而统计数据打架,尤其是这些统计数据又都出自不同“权威部门”,公众就会认为这种统计根本没有公信力,并且担心任何一种偏信都会违背现实,据此作出的政府决策根基不稳,所以最终只好信也不是、不信也不是。

在国外也有统计数据打架的时候。每当遇到这种情况,决策部门通常有一条基本原则,那就是采信弱势数据,信忧不信喜,防患于未然。

由此推及到我国,在遇到统计数据打架时,统计部门有必要真诚地出面解释这究竟是什么原因造成的,让公众明辨是非;并且要进行反思,看统计指标是不是有值得改进或需要补充、解释的地方。

归根到底,发布统计数据的目的是让公众看得懂、用得上、无歧义。如果达不到这种效果,这样的统计数据不要也罢。

例如,2010年7月国家计划生育委员会公布的《省级人口个案库数据质量评测结果》表明,2000年到2009年间我国20个省的人口出生总数比计划生育统计报表数据要高出12%。特别需要指出的是,与其他“数据打架”不同,这两个数据都出自计划生育部门,所以被人形容为“数据内讧”。

北京大学社会学教授郭志刚坦言,当他听说人口计划生育统计数据漏报率为12%时并没有“吓一跳”,因为过去一直流传这个数据是“30%”的。事实上,这些数据一直是糊涂账,就连不懂统计工作的老百姓也知道,在超生就要罚款的政策下,个人因为超生故意不报甚至举家迁移、地方政府为编报政绩故意瞒报超生人数,早就已经司空见惯 4。

再例如,自从2008年末我国政府出台应对全球金融危机的4万亿元人民币经济刺激计划后,公众对经济数据的关注度达到空前状态。而进入2009年后,我国经济增长速度在全球一枝独秀;与此同时,一些统计指标却不断反复,并且出现明显矛盾和打架现象,这时候就非常需要统计部门用令人信服的数据、证据来解释了。

以2009年5月的统计数据为例,当时的宏观背景是,我国居民消费价格总水平(CPI)、工业品出厂价格指数(PPI)已经连续4个月在负数区间运行,进出口连续下滑、用电量连续下降、企业利润连续回落、民间投资连续不振,可是当月全国工业增加值却依然增长8。9%,这究竟是为什么,就很值得统计部门出面解释。

章节目录