关灯
护眼
字体:

7 平均数 它在多数情况下毫无意义(第1页)

章节目录保存书签

7平均数:它在多数情况下毫无意义

“浙江许多人均指标都居全国领先水平,通常被人们称作富省,可这个‘富’是相对的,是初级阶段的,绝不能因为一些平均数而忽略全省存在的贫困面。”

——摘自某公开报道

这番话出自浙江省原省长、全国人大代表吕祖善之口,反映出这位父母官对经济发达的浙江省的省情有着非常清醒而可贵的认识 1。

确实,在有些情况下,以“平均数”代替“大多数”似乎无关紧要,但在一些重大问题上则必须将两者分开。俗话说“饱汉不知饿汉饥”,对于腰缠万贯、一掷千金的富翁来说,他怎么也不会想象得出赤贫者是如何因为哪怕缺少1元钱就挨饿、受冻的。“平均数”决不能代替“大多数”,有时候甚至也不能代替“极少数”。

在统计学中,平均数的主要作用是描述“数据的集中趋势”,即“数据向某一中心值数据聚拢的倾向”;或者是数据的“一般水平、代表值或典型值”。

容易看出,平均数属于一种概括性指标。由于受离群值(极端值)的影响,平均数往往容易掩盖个体差异。有鉴于此,许多情况下平均数什么问题也说明不了。

例如,一家小餐馆里有两位顾客,一位顾客喝了1斤白酒,另一位顾客吃了2碗泡饭。如果用平均数看,他们两人平均每人喝了半斤白酒,吃了1碗泡饭,看上去好像还不错。而实际上呢,两个人似乎都很不好——一个人喝酒喝醉了,另一个人吃得太饱了。

这种平均就根本不符合事实,也没有意义,因为它的“离散度”(反映一组数据离散程度的统计学指标)太大了。

再例如,如果有人问你全班同学的身高是多少?你当然可以用平均身高来回答。因为每个同学的身高不一样,你即使知道每个同学的身高也没必要一个个报出来,否则对你来说就太琐碎了,而对方也未必就需要这样的数据。你只要报出平均身高是多少,如果更细致一点,报出男生平均身高是多少、女生平均身高是多少,对方就知道了大概。

但显而易见,这种平均身高并不能看出全班同学中最高和最低的同学身高是多少。即使两个班级同学的身高平均值完全相等,这两个班级最高(低)同学的身高也不一样。所以,在掌握了平均身高时,如果有必要还必须掌握最高、最低的同学身高是多少。

现实社会中,“平均数”和“大多数”是工作中常常听说的概念。有些情况下以“平均数”代替“大多数”无关紧要,可是在一些重大问题上,则必须将“平均数”与“大多数”区分开来,绝不能以“平均数”代替“大多数”,甚至不能以“平均数”代替“极少数”。

统计课上老师经常举例的一则笑话说,一位不会游泳的统计学家遇到面前的一条小河时硬是不敢趟过去,后来他听别人说这条小河的“平均”水深只有0。5米,就勇敢地下河了,没想到最终被淹死在河里。

原来,这条小河的平均水深确实只有0。5米,可是它的最深处却超过2米。这最深处“2米”虽然是“极端值”,可是你能说可以因此忽略吗?可怜的是这位统计学家仅仅掌握了“数据的集中趋势”,却忽略了河中最深处和最浅处的变化,当然要付出生命代价了。

平均数的种类多种多样,可以说是个“大家族”。因此,搞清楚有哪些平均数,对读者如何理解平均数会有很大帮助。

一般来说,平均数可以分为算术平均数、几何平均数、调和平均数 2、加权平均数、平方平均数等几类。为了更好地说明问题,下面我们对最常用的三种平均数以列表方式加以比较:

各种各样的平均数中,最常用的是算术平均数和加权平均数。

所谓算术平均数,是指对没有分组的原始数据简单相加后得到的平均数,又叫平均值。

例如,某企业的A部门有5个人,他们的年收入分别是8、5、4、3、2万元,这时候就只能用简单算术平均数来计算该部门的人均年收入(因为其中找不到完全相同的两个数字,无法赋予权数),结果是(8+5+4+3+2)÷(1+1+1+1+1)=4。4万元。

所谓加权平均数,是指对已经经过分组的原始数据进行平均。分组后的原始数据可能会出现相同数字,而且有可能会有多个相同数字出现,这时候某个数字出现的次数多少就叫频数,这也是加权平均数中所说的权数。

例如,该企业的B部门也是5个人,他们的年收入分别是8、6、5、5、1万元。这时候如果要计算B部门的人均年收入,那么既可以用算术平均数法计算也可以用加权平均数法计算。

用算术平均数法计算得到的结果是(8+6+5+5+1)÷(1+1+1+1+1)=5万元,用加权平均数法计算得到的结果是(1×8+1×6+2×5+1×1)÷(1+1+2+1)=5万元。容易看出,这两种计算方法得到的结果是相同的,但后者的计算更简单,甚至会简单得多。

例如,如果要计算该企业A、B两个部门的人均年收入是多少,这时候当然也可以用算术平均数法来计算,但由于其中年收入8万元的人有2个、年收入5万元的人有3个、年收入6、4、3、2、1万元的人各有1个,所以用加权平均数法来计算更简单。

在这里,“2”个人、“3”个人、“1”个人分别就是它们的权数。具体计算过程是(2×8+3×5+1×6+1×4+1×3+1×2+1×1)÷(2+3+1+1+1+1+1)=4。7万元。

容易看出,算术平均数是加权平均数的一种特例。当加权平均数中权数全部是1时,这时候它就变成了算术平均数。

加权平均数的大小受两个因素影响,一个是各组数值的大小,另一个是各组分布的频数多少。毫无疑问,哪一组的频数越多,这组数值对于平均数的影响作用就越大。

章节目录