在当今社会中生活,会遇到各种各样的数据。
当你打开电视,你会看到电视歌曲大奖赛正在举行,歌手们正焦急地等待着自己的最后得分;翻开报纸,社会调查机构在向你介绍10~14岁的孩子们,最喜欢什么,最不喜欢什么……
正由于统计学做的就是收集、整理和分析数量信息的工作,因此它在今天的社会中变得越来越重要了。
这里,我们打算举出一些典型的统计学悖论,让迷信数据的人们有所警觉——数据中也有陷阱。
骗人的“平均数”
刘木头开了一家小工厂,生产一种儿童玩具。
工厂里的管理人员由刘木头、他的弟弟及其他六个亲戚组成。
工作人员由5个领工和1 0个工人组成。
工厂经营得很顺利,现在需要一个新工人。
现在,刘木头来到了人才市场,正与一个叫小齐的年青人谈工作问题。
刘木头说:“我们这里报酬不错。
平均薪金是每周300元。
你在学徒期间每周得75元,不过很快就可以加工资。
”
小齐上了几天班以后,要求和厂长刘木头谈谈。
小齐说:“你骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。
平均工资怎么可能是一周300元呢?”
刘木头皮笑肉不笑地回答:“小齐,不要激动嘛。
平均工资确实是300元,不信你可以自己算一算。
”
刘木头拿出了一张表,说道:“这是我每周付出的酬金。
我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。
总共是每周6900元,付给23个人,对吧?”
“对,对,对!你是对的,平均工资是每周300元。
可你还是骗了我。
”小齐生气地说。
刘木头说:“这我可不同意!你自己算的结果也表明我没骗你呀。
”
接着,刘木头得意洋洋地拍着小齐的肩膀说:“小兄弟,你的问题是出在你根本不懂平均数的含义。
怪不得别人呦。
”
小齐气得说不出话来,最后,他一跺脚,说:“好,现在我可懂了,我不干了!”
在这个故事里,狡猾的刘木头利用小齐对统计数字的误解,骗了他。
小齐产生误解的根源在于,他不了解平均数的确切含义。
“平均”这个词往往是“算术平均值”的简称。
这是一个很有用的统计学的度量指
类似的会引起误解的例子有很多。
譬如,报纸上报道有个人在一条河中淹死了,这条河的平均深度只有2尺。
这不使人吃惊吗?不!你要知道,这个人是在一个10多尺深的陷坑处沉下去的。
2.平均人数的家庭
在南方的某个城市里,诞生了一个5胞胎姐妹。
这种事情并不容易发生,所以,地方报纸刊登了这个家庭的照片,有父亲、母亲,还有那5个可爱的孩子。
报纸主编对这张照片很满意。
他对摄影记者小李说:“干得好,小李。
我有了一个新构思,你给我弄一张这个城里平均大小的家庭的照片来。
可是小李根本无法完成这个任务,为什么?因为统计的结果表明这个城里家庭的平均小孩数是1.5个。
而我们知道,满足这种平均数的家庭是不可能找到的。
这是关于“平均”的又一个错误概念。
人们总是以为平均的实际例子必然存在,其实未必!
3.轻率的结论
在你听到一种统计关系时,可得慎重一些,千万不要轻率地对事件友生的因果关系作出判定,
因为事情并不那么简单。
让我们来看几个不可轻率作出结论的例子。
①统计资料表明,大多数汽车事故出在中等速度的行驶中,极少的事故是出在大于150公里/小时的行驶速度上的。
这是否就意味着高速行驶比较安全?
正确答案:绝不是这样。
统计关系往往不能表明因果关系。
由于多数人是以中等速度开车,所以多数事故是出在中等速度的行驶中。
②有一个调查研究说脚大的孩子拼音比脚小的孩子好。
这是否是说一个人脚的大小是他拼音能力的度量?
正确答案:不是的。
这个研究对象是一群年龄不等的孩子。
它的结果实际上是因为年龄较大的孩子脚大些,他们当然比年龄小的孩子拼得好些。
③常常听说,汽车事故多数发生在离家不远的地方,这是否就意味着在离家很远的公路上行车要比在城里安全些呢?
正确答案:不是,统计只不过反映了人们往往是在离家不远的地方开车,而很少在远处的公路上开车。
④有一项研究表明某一个国家的人民,喝牛奶和死于癌症的比例都很高。
这是否说明是牛奶引起癌症呢?
正确答案:不对!原因是这个国家老年人的比例也很高。
由于癌症通常是年龄大的人易得,正是这个因素提高了这个国家癌症死亡者的比例。
上述例子表明,统计学论述在涉及到因果关系时很容易造成误解。
现代的广告,尤其是很多电视的商业广告正是以这种统计误解为其根基的。