那让们来看下数据背后真相吧!首先让们调整下纵轴坐标比例。这样看起来,原来似乎很明显鸿沟变得非常小。然后们再来看看同样数据,它分布是什样?们来看下特定年数学成绩分布和收入水平分布。用这样方法们就可以理解,平均数背后代表数据分布究竟是什样子。
看到吧,男性和女性数学成绩分布几乎是完全重合。大多数女性和男性数学成绩是差不多。们再看看美国和墨西哥个人收入分布情况。们可以看到美国和墨西哥个人收入水平是有部分重
简单、直观而且情绪化方法。因为这种分为二方法,暗示矛盾冲突。所以们总是不假思索地采用这种方法。
记者们都明白这点,他们在自己文章中都会描述对立人、对立观点,或者对立群体。他们更喜欢讲述是那些极度贫困人或者亿万富翁故事,而他们没有兴趣去讲述绝大多数人缓慢提高自己生活水平故事。不仅仅是记者们擅长分为二地讲故事,纪录片和电影制造商们也喜欢这样讲故事。纪录片里面总是描述脆弱个人对抗邪恶巨型企业。而商业片中,总是刻意描画好人和坏人斗争。
这种分为二本能会误导们,把平滑过渡当作两极分化,把和而不同当作分道扬镳,把求同存异当作矛盾对立。这是们所介绍第个错误本能,因为它是如此普遍,而且根本性地误导们对数据理解。如果你看看新闻或者去任何个社会团体网站,你就会马上注意到,上面充满关于各种冲突和对立消息。
如何防范分为二错误本能
当出现以下三种情况时,你要提高警觉,有人可能会告诉你(或者你自己认为)存在个巨大差距,并触发你分为二本能。这三种情况分别是:只比较平均数、只比较极端情况和只俯视不仰视。
只比较平均数
希望大家不要误解意思,喜欢平均数,平均数是个很简便统计信息方法,而且平均数会告诉们些有用信息,现代社会离不开平均数。这本书也离不开平均数。书中有很多地方都利用各种平均数。但是对信息过度简化,通常也有可能带来误导性信息。平均数最大问题就是它用个单独数字取代大量数据分布规律。
而当们对两组平均数做比较时候,们就有可能犯个更大错误。们可能只看到两组平均数之间鸿沟,而错过两组数据之间重合部分。所谓鸿沟在事实上并不存在。
举个例子,们看下上面两张图。
左边图展示自从1965年以来,所有年份男性和女性数学考试平均成绩。右面图展示美国和墨西哥人民每年平均收入水平。你可以清晰地看到两张图表展示两组平均数之间鸿沟。男性相对于女性,美国相对于墨西哥,这两张图似乎能够清晰地表示男性数学成绩普遍要好于女性,而美国人收入是高于墨西哥人。从某种意义上来说,这个结论是有道理。但是正确到什程度呢?是所有男性数学成绩都比女性要好吗?是所有美国人都比墨西哥人更富有吗?
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。