1 统计口径 读懂统计数据的基本前提(第1页)
1统计口径:读懂统计数据的基本前提
(浙江省)从全省2007年1至10月经济统计数据看,全省完成实到外资77。41亿美元,但按商务部统计口径仅48。34亿美元,不被商务部统计的数据高达29。07亿美元,占上报数的37。6%。
——摘自某公开报道
阅读统计数据,必须从关注或明确统计口径开始。只有首先明确这个统计指标的口径,才能判断这些数据究竟离实际有多远;口径不同的统计数据不能放在一起相互比较,否则不但不能真正发挥作用,而且还会产生误导,影响个人判断和政府决策。
所谓统计口径,是指这些统计数据的来源或包括范围。用最通俗的话说就是,这些统计数据是从哪个“口径”出来的。当然,不同的统计口径后面反映着不同数据的质量高低,甚至还有不同的政治利益或不怀好意在内。
读者平时听得最多的不是“统计口径”而是“统一口径”,这两者既有联系也有区别。统计口径按理说应当是统一的,因为只有统一口径的统计数据,相互之间才有可比性;然而,并不是所有统计口径都是统一的,也就更谈不上这些统计口径是科学的了。明白了这一点容易发现,读者平时难以理解的统计数据往往或多或少存在这些问题。
凭空讨论统计口径比较难理解,下面举一个有关流动人口方面的统计数据,就能一清二楚地了解其中奥秘了。
在我国,流动人口的人数、流向和规律,是政府决策的重要依据。然而在过去20多年里,我国并没有统一的流动人口统计口径,所以各部门得到的流动人口数据不但各不相同,而且非常悬殊。
在国外,通常没有“人口流动”、“流动人口”这样的指标,只有“人口迁移”、“迁移人口”概念。为什么呢?因为人口流动是我国的独有现象,流动人口是我国独特的人口群体。
人口流动和人口迁移有什么不同?根据国际人口科学联盟主持编写的《多种语言人口学辞典》解释,所谓人口迁移是指“在一个地区单位同另一个地区单位之间进行的地区移动和空间移动的一种形式,通常它包括从原住地或迁出地迁到目的地或迁入地的永久性住地变动”。
不难看出,人口迁移必须具备两个条件:一是时间上的“永久性”(确切地说,应当是“长期性”,并不是说人口迁移后就不能再发生第二次迁移了);二是空间上的“足够远”。
在我国,虽然人口迁移同样存在,可是由于受户籍制度影响,读者平时看到或听到的更多是人口移动,其主要区别在于户口是不是跟着人走。如果这种时间和空间上的移动,户口也跟着走,就称为人口迁移,这样的人称为迁移人口;如果户口不跟着动,就称为人口移动,这样的人称为移动人口。
所以,在进行国内外人口迁移或人口移动数据对比时,就必须弄清其中的统计口径有什么不同。否则,同样的数据就不但没有可比性,而且会闹出许多笑话来,用于政府决策则会坏了大事。
我国的户口管理部门通常设置在街道、乡镇一级派出所,所以当在街道、乡镇以上行政范围空间位置移动时,才可能牵涉迁户口 1,这时伴随着迁户口产生的就是人口迁移;而在人口流动方面由于没有户口迁移作标志,所以统计口径上必须有一个明确的“空间”和“时间”界定,否则就无法正确反映流动人口规模。
举例说,一个人从屋里的一个房间进入另一个房间,或者从楼上跑到楼下,或者因为房屋拆迁暂时居住在儿子(女儿)家过渡,这些虽然实际上都发生了时间和空间移动,就不能算“人口流动”。
不用说,这种“空间”和“时间”界定既不能太大也不能太小,否则就无法准确反映人口迁移和人口流动状况。目前我国各部门有关人口流动规模的统计数据相差甚远,一个重要原因就在这里。
例如,我国从1982年开展第三次人口普查以来的每一次人口普查和全国1%的人口抽样调查,在涉及人口流动数据搜集方式上时有改变,统计口径也有变化,尤其是2005年那次变动更大 2。例如1982年、1990年流动人口的“时间”、“空间”界定为“跨县(市、区)”、“一年以上”,就把同一个县(市、区)内不同乡镇(街道)之间的人口流动排除在外了;而不同乡镇(街道)之间的人口流动比例实际上非常高(约占流动人口总数的30%)。
而1995年1%人口调查的统计口径,“空间”就缩小为“跨乡镇(街道)”,“时间”则缩短到“半年以上”。根据这一口径,推算出全国流动人口总数为7073万人,约占全国总人口的6%,比1982年的1。75%、1990年的1。89%提高了2倍多。显然,6%的统计数据更接近于事实 3。
且先别为这种“进步”高兴。实际上,过去历次统计中并没有引起足够重视、这时候在人口流动中所占比重已经非常大的“人户分离现象”依然没有得到严格区分,严重损害了流动人口统计数据质量。
所幸的是在2000年人口普查中,在继续保持“跨乡镇(街道)”、“半年以上”统计口径的同时,已经有效区分了两者。在此前提下,当年的统计数据是,2000年全国城市市区范围内的市内“人户分离”规模为3600万人,流动人口10175万人(其中县内流动人口3100万人、省内跨县流动人口3375万人、跨省流动人口3700万人)。
而到了2005年全国1%人口抽样调查中,调查对象与过去只调查“常住人口”不同的是,还包括“户口在本户、2005年10月31日晚未居住在本户的人。”这样,就较好地在全面了解这个地区流入人口的同时,比较容易了解流出人口情况。同样的道理,对城市里的“人户分离”情况来说,既能了解到过去“人在户不在”的情况,也可以了解到“户在人不在”(简称“空户”、“空挂户”)的情况。而随着我国进入老龄化社会,这种“人户分离”情形将会越来越突出。
与此同时,从2005年1%的人口抽样调查开始,还把“时间”和“空间”的界定标准分开来统计,并且增加了“半年以下”统计口径,这样就为完整分析统计数据提供了更多素材。
读者如果了解到上述各次人口数据统计口径方面的差别,就能更好地理解和利用这些统计数据了。
例如,以2005年的1%人口调查数据为例分析,既要考察流入人口又要考察流出人口;要尽量把城市市区范围内的“人户分离”人口从流动人口数据中分离出来,因为这实际上是两个不同概念;在考察统计口径的“时间”界定方面,时间标准越小越好,时间标准越小表明其中包括的短期流动人口数据越真实 4。
毫无疑问,每一次统计口径的改变都会直接影响统计数据质量以及数据大小,牵涉到方方面面的利益。
例如,在本案例中,浙江省从2008年开始按照国家商务部的口径统计利用外资数据,从而成为全国沿海地区最后一批与国家商务部统计口径并轨的省市之一。单纯从统计数据看,浙江省按原口径所得到的统计数据是2007年1月至10月完成实到外资77。41亿美元,而按照商务部的统计口径该数据就只剩下48。34亿美元 5。
再例如,针对国际能源署发布的数据认为“中国2009年消费22。52亿吨石油当量,比美国石油消费总量21。70亿吨高出4%,从而成为全球第一大能源消费国”的说法,国家能源局综合司在2010年7月20日举行的“上半年能源经济形势新闻发布会”上表示,国际能源署公布的数据不但不可信,而且该组织可能对我国近几年来的能源发展状况一知半解 6。厦门大学中国能源经济研究中心认为,无论什么组织发布什么报告,都必须以我国统计口径为主,世界能源署的统计数据不排除采用另一套统计口径,“如果统计口径不一致就没有可比性”。
统计口径不一致,当然就没有可比性,这显而易见。但如果有关专家能够指出国际能源署和我国国家能源局的统计口径在哪里不一致,或者最好能折算成同一口径进行比较,就有说服力了。
记者对此研究发现,原来,世界能源署采用的当量单位为“石油当量”,我国国内统计中普遍采用的是“煤当量”,所以两者之间的数据无法直接比较。但只要根据我国GB2589-1990《综合能耗计算通则》中的规定进行换算,就可以发现世界能源署统计的能源消费量为942912。4亿MJ 7,我国国家统计局的统计数据为908535。6亿MJ,相差3。78%,我国仍然是高于美国的。
由于不同的统计口径会直接决定统计数据大小,所以经常有统计部门会人为利用这种统计口径调整来调节自己的目标数据。
例如,2008年北京奥运会前夕,美国驻华使馆出于关心工作人员健康考虑,在新使馆落成之际,在使馆内的一栋大楼上建立了一处空气监测站,用来监测当地空气中可深入肺部的悬浮颗粒(PM2。5)数据,监测结果每小时在推特网上发布一次。自从有了这一举动后,北京环保部门的检测数据便屡屡受到质疑,主要原因之一就是口径不同。
2011年10月31日是我国新发布的《环境空气PM10和PM2。5的测定重量法》正式实施前一天,有心人发现,当天美国驻华使馆监测到的北京空气质量指数为307(PM2。5 8细颗粒物浓度为257),属于“危险” 9级别;而我国国家环境保护局公布的当天北京空气污染指数为132,属于“三级轻微污染”,两者数据几乎相差一倍 10。