关灯
护眼
字体:

7 平均数 它在多数情况下毫无意义(第2页)

章节目录保存书签

相反,算术平均数的大小更容易受极端数值影响。例如在上述A组的5个人中,如果年收入最高的不是8万元,而是36万元,那么这时候A组的5个人平均年收入就达到10万元,而实际上这5个人中只有1人超过这个数,其他4个人不仅没有达到这个数,而且相差不少;而如果去掉这个最高数,这时候其余4个人的人均年收入就只剩下了2。8万元,虽然不怎么“好看”,却更接近实际。

与算术平均数、加权平均数相比,几何平均数主要用于对比率、指数等数值进行平均,用来计算平均发展速度。

在加权平均数中,除了一组数据中的某个数出现的频数称为权数以外,权数还有更广泛的含义。

例如,在一些体育比赛项目如跳水比赛中,每个运动员除了要完成规定动作外,还必须完成一定数量的自选动作。而既然是自选动作,那么这些动作的难度就是各不相同的。要在不同的运动员之间进行比较,就必须用权数进行衡量,这就是大家通常听到的“难度系数”。如果两位选手自选动作难度系数不同,即使完成的跳水动作质量相同,得分也不一样。道理很简单,难度系数大的运动员得分会高些、难度系数小的运动员得分会低些,这实际上就是权数在起作用。

在企业里,分配奖金时常常会用到奖金系数,不同岗位、不同员工之间的奖金系数各不相同,实际上这里的奖金系数也是一种权数。

在中小学校,期中考试、期末考试、平时小测验都与成绩报告单上的分数有关,而这些考试分数的权数也不相同。

如果某个学生的期中考试成绩是90分,期末考试95分,平时小测验100分,这时候出现在报告单上的成绩一般就不会是算术平均数的(90+95+100)÷(1+1+1)=95分,而会是加权平均数。

假如该学校的期中、期末、平时小测验权数分别是30%、50%、20%,那么这时候出现在成绩报告单上的分数就是(90×30%+95×50%+100×20%)÷(30%+50%+20%)=94。5分了。

与“平均数”相对的是“大多数”、“极少数”。“大多数”比较容易理解,极少数就容易被忽略,而实际上呢,既然它是客观存在,就是不能忽略的。尤其是在社会人文领域,这种“极少数”的意义更大。

例如,全面建设小康社会、早日实现小康目标,一个十分重要的指标是看城乡居民人均年收入达到多少标准。从考核指标看,这时候只能衡量这样的“平均数”;可是在老百姓眼里,是否达到小康水平在看“平均数”的同时,更要看达到这种“平均数”的人数多少,因为“平均数”并不代表“大多数”。

如果,一家企业老板的年收入是200万元,他的企业有50名员工,这些员工的平均年收入是2万元,你能说这个企业员工平均收入是5。88万元吗?显然不行。如果你按照年收入5。88万元向他们征收个人所得税,一定行不通。

可是在现实生活中,这种用“平均数”掩盖“大多数”的情形比比皆是。一些地方和部门的工作重点和注意力,就是放在如何拔高“平均数”上。这就要求读者在阅读、分析有关平均数指标时,能从这个角度去考虑问题,避免以偏概全。

除了算术平均数、几何平均数等称为平均数外,众数、中位数也是平均数。不但如此,以众数、中位数为代表的平均数,在存在异常值的情况下,更能反映统计数据的集中趋势。

不用说,在绝大多数情况下,一组数据中总会存在异常值。这表明,在大多数情况下众数、中位数更能反映“平均”值。

先看众数。所谓众数,是指在统计分布上具有明显集中趋势的那个数字,它最能代表统计数据的一般水平。用读者容易理解的话说就是,众数就是一组数据中出现次数最多的那个数。众,多也。

容易看出,如果这组数据中出现的数据次数一样多,这时候也就无所谓众数不众数了,换句话说,这时候没有众数。

例如在上述A部门的5名员工中,每个人的年收入各不相同,就表明这组数据没有众数。而在B部门的5名员工中,有两位员工的年收入相同(都是5万元),这时候就说这组数据中出现了一个众数(2个人,5万元)。如果以众数来代表平均数,这时候就可以说,这些员工的人均年收入是5万元 3。要注意的是,有时候在一组数据中会有多个数据出现相同的次数,这时候就说这组数据中的众数不只1个。

用众数作为平均数的好处是不受极端数据影响,而且计算简单。因为既然是极端数据,它的出现次数必定不多,很自然地就被排斥在众数之外。至于计算简单,有时候根本就不用计算,用眼睛简单地看看就能看出这组数据中出现次数最多的是哪个数了。

用众数作为平均数的缺点是可靠性比较差。所以,一组数据中如果个别数据有很大变动,这时候选择中位数来表示“数据的集中趋势”更合适。

所谓中位数,是指将一组数据按照某种顺序排列后位于最中间的那个数。显而易见,这时候大于中位数的数字恰好有一半,小于中位数的数字也恰好有一半。正因如此,它才有权代表“平均数”。中位数的主要作用,就是排除极端数字影响,代表总体数据的中等情况。

以上述A、B部门为例,这两个部门都是5个人(奇数),所以位于最中间的那个数(第3个数)就是中位数 4。在A组中,中位数是4万元,这时候就说A部门的人均年收入是4万元;而B组中的中位数是5万元,这时候就说B部门的人均年收入是5万元。

容易看出,用中位数代表平均数有时候更容易反映事物本质,道理很简单,因为它具有“一半在我之上、一半在我之下”的观测作用。

前些年有一首打油诗是这样说的:“村上有个张百万,9个邻居穷光蛋,平均收入算一算,家家都能有10万。”

显而易见,这里的计算方法就是简单算术平均数或加权平均数;如果采用众数或中位数来表示每户平均年收入,数字就都变成了0。而从实际情形看,平均年收入是0要比10万元更能代表真实情况,毕竟这村上的10户人家中有9户的年收入是0。

所以,读者在了解到某单位、某地区甚至某个国家的人均年收入是某个数值时,如果不知道这个平均数究竟是算术平均数、加权平均数、众数、中位数还是其他什么,它对你的意义就不大。

换句话说,如果你对某个“平均数”有所怀疑的话,就很有必要继续考察它的“中位数”是多少。也就是说,在完全剔除了极端数据后,再来看看它的“平均数”有多大。

算术平均数和中位数虽然都是“平均数”,但中位数却是算术平均数的“克星”——它既是算术平均数的最大竞争对手(避免被统计数据所蒙蔽),又最容易被找到(不需要经过复杂计算一眼就能看出来)。

章节目录