孩子常用的数字暗号:经不起拷打的数字难以定义的真相
编者按:我们习惯于一件事情要么是真,要么是假,但“后真相”(Post-Truth)则既不是彻底的真相,也不是纯粹的谎言,它是指大众舆论中那种真相和逻辑被忽视,而情感和偏见占据主导的情形。2016年,在特朗普当选美国总统和英国通过公投脱欧两件“黑天鹅”事件接连发生之后,《牛津大词典》把“后真相”选为了年度词汇,有学者提出,传统主流媒体奉为圭臬的“真相”已经衰落,我们已经进入了一个“后真相时代”,而后浪出版社近期出版的《后真相时代》正是一本全面剖析“后真相”现象如何诞生的书。
在“后真相”现象中,数字是一个毫无疑问的帮凶,虽然人们常说“数字不撒谎”,但是还有一句刚好相反的话是“只要拷问数字,它们就会承认任何罪名”,数字本身当然不会说谎,但是对于如何使用它却有着太多的玄机和奥秘,本期巴伦书摘选自《后真相时代》第四章《数字》,我们可以看到四种如何通过“拷打”数字来隐藏和扭曲真相的叙事策略。
文| 赫克托·麦克唐纳
编辑| 彭韧
数字是神奇的。它们可以提供语言常常无法提供的关于世界的清晰度。我们可以用数字来比较、评价事物,测量变化,总结出一个人物的一系列优秀品质。数字可以被任何文化中的任何人理解。它是一种世界语言。问题在于,我们许多人在很多时候对数字存在误解。即使是两个接受过统计学培训的科学家也看不出他们自己的数字说明了什么,难怪那么多人会对数字的含义感到困惑。
这不是数学能力问题。如今,我们很少有人需要口算乘除法。你可能不知道什么是二次方程,但这没有关系。对于管理家庭预算和为负责任的政府投票的人来说,重要的是理解某个具体数字意味着什么。
由于我们许多人在看到一个统计量、一所新学校的成本或者一个群体的规模时很难知道它的真正含义,误导者可以暗示他们所希望的含义,从而影响现实。数字本应是目前最透明的沟通形式,因此它本应最不容易被人误用。不过,我们却在生活中的各个领域看到了由数字支持的竞争性真相。
左撇子“早死”之谜
左撇子常常遇到麻烦。土豆削皮器和剪子是为右撇子设计的。拳击课程会被“南爪子”搞乱。在支票簿或活页簿上写字会成为一项艰难的任务。在拥挤的餐桌上用左手喝汤很容易引发事故。就连不起眼的裤子拉链也对右撇子有利。不过,当两位著名心理学家1991年发布的研究报告指出左撇子比右撇子平均早死9年时,左撇子似乎遭受了更大的打击。
加利福尼亚州立大学圣布纳迪诺分校的黛安·F·哈尔彭博士(Dr Diane F. Halpern)和不列颠哥伦比亚大学的斯坦利·科伦博士(Dr Stanley Coren)研究了1?000名加州人的死亡时间,发现右撇子的平均死亡年龄是75岁,左撇子的平均死亡年龄是66岁。在《左撇子:生存适应性下降的标志》一文中,他们声称:“左利手的一些较大风险显然来自提升他们事故发生率的环境因素。”作者的逻辑是,工具和车辆是为右撇子设计的,所以左撇子容易发生汽车或电锯事故。《纽约时报》沮丧地指出:“在20多岁的人群中,左撇子的比例是13%,但在80多岁的人群中,左撇子只占1%。”看起来,左撇子和吸烟对于健康具有同等危害。
左撇子注定早死的观念迅速传播开来。到了2013年,英国广播公司认为他们有必要重新考虑这个问题:“左撇子真的会早死吗?”
答案是否定的。这完全是胡说八道。科伦和哈尔彭误解了他们在数字中发现的真相。他们成了误传者。
我成长于宽容的20世纪70年代,当时人们积极鼓励我接受自己是左撇子。之前的人就没有这么开明了。“不祥的”和“笨拙的”左撇子受到人们的怀疑,他们被认为受到了魔鬼的触摸。左撇子遭到了回避和歧视。因此,父母会尽量将孩子培养成右撇子。用左手吃饭或写字的婴儿会迅速被纠正过来。左撇子的自然比例是10%到12%,但在19世纪和20世纪早期,被视为左撇子的人口比例要小得多。直到最近,天生的左撇子才有可能以左撇子的身份成长。
因此,在1991年,左撇子群体的平均年龄低于右撇子群体。所以,左撇子的死亡年龄应该比同时期死亡的右撇子小。我可以通过类比说明这一点。已经去世的数字土著的平均死亡年龄小于非数字土著。这一定是真的,因为所有在互联网普及时代出生的人全都低于25岁。这并不意味着数字土著的身份对健康有害。
1991年去世的左撇子的确比右撇子年轻得多。不过,这个真相受到了广泛的误解,使世界各地的左撇子产生了不必要的恐慌。事实上,年龄相同的左撇子和右撇子具有几乎相同的寿命预期,这个竞争性真相应该可以使那些仍然在为寿命而焦虑的左撇子感到安慰。
苹果、橘子和芝加哥谋杀
在谈论数字之前,我们需要考察数字究竟代表了什么。吹嘘雇佣记录的企业谈论的是全职员工、合同工、无薪实习生还是等效全职工?煽动者引用的数字是移民、非法移民、经济移民还是难民?接受救济的人是失业者还是仅仅有资格获得儿童或低收入支持的人?喜欢某产品的人是全体人民中的70%,还是最近被该产品的广告轰炸过的小镇上70%的受调查者?政府统计量指的是玉米种植量还是玉米销售量,是家庭还是个体,是纳税人还是居民?这些区别之中存在着大量的调整空间,这为竞争性真相提供了机会。
加拿大和澳大利亚拥有全世界最高的儿童劫持率。是的,这是真的。这不是因为它们比墨西哥和哥伦比亚更加危险,而是因为两国政府将儿童监护权争端包含在了劫持儿童的统计数据中。类似地,瑞典的强奸率据说排在全球第二位,每年每10万居民中有60起案件报告(印度的强奸率是十万分之二)。不过,这不仅说明瑞典性犯罪的报告率较高,而且体现了更加宽泛的强奸定义。
2001年,为了支持在北极国家野生动物保护区开采石油,美国副总统迪克·切尼(Dick Cheney)声称,只有2 000英亩土地将会受到影响,其面积相当于“杜勒斯机场的1/5”。事实上,他只统计了建造“生产和支持设施”的土地,这既不包括公路和相关基础设施占用的土地,也不包括靠近钻探地点,可能打扰野生动物或污染环境的土地。此外,在建设地上管道的地区,只有支撑管道的支柱被统计到了建设面积之中,管道其余部分下方的土地被排除在外。切尼的数字极具误导性,他的提案随后被参议院驳回。
数字策略之一:选择有利单位
当特朗普总统2017年对国会说“9400万美国人没有工作”时,这似乎意味着所有这些人都是被动失业者。实际上,这个来自劳工统计局的数字包括所有16岁以上的学生、退休人员以及那些选择不工作的人。真实的美国失业数字——想工作但是无法获得工作职位的人——在2017年年初约为760万,不到特朗普所说数字的1/10。
类似地,当特朗普宣称“像阿富汗这样的地方比我们一些城市的中心区还要安全”时,他要么记错了,要么有意曲解了芝加哥谋杀案和美国人在阿富汗死亡人数的对比。2001年到2006年,芝加哥有记录的被害人数为7916人。同一时期,2384人在阿富汗遇难。阿富汗的暴力死亡总人数要高得多(一位学者估计,2001年以来,超过10万人在阿富汗被害),相对较少的美国人在阿富汗的暴力死亡率明显高于芝加哥。特朗普的说法指的是在芝加哥被害的美国人比阿富汗要多,但是生活在芝加哥的美国人要多得多。根据这种逻辑,他完全可以说,在太阳上生活更加安全。
一款沐浴露产品的市场宣传材料称:“原始薄荷茶树沐浴露浓缩了7927片真实薄荷叶。”数字7927以很大的字号印在瓶子上。7927片薄荷叶很多吗?我不知道。制作几毫升精华油需要几千朵玫瑰,所以这个数字也许并不多。不过,这款产品显然暗示了这是一个很大的数字。
在塑造品牌这一轻松背景下,这并不十分重要。不过,下面的说法呢:
我们正在雇用1000名新护士。
我们的全新送货车辆每年可以节省100万加仑燃料。
这些数字很大吗?发表这些言论的人显然想营造这样的印象。不过,在了解背景之前,我们无法做出判断。在只有大约8000个专业护士的爱沙尼亚,新增1000名护士是一项了不起的成就。在护士群体大约有90万人的德国,这些新人几乎不会引起人们的注意。对于UPS这种拥有十几万辆送货车的公司,每年100万加仑燃料只是一个舍入误差而已。
现在的英国年轻人买房很困难,这在很大程度上是因为“可负担”住宅的短缺。在2017年10月的一次重要演讲中,首相特蕾莎·梅宣布:“我会在首相任期内专注于解决这个问题。”她还说:“今天,我可以宣布,我们将在可负担住宅上新增20亿英镑的投资。”首相想表述一个很大的数字,但媒体迅速戳破了她的泡沫:20亿英镑(26亿美元)可以多建造2.5万套住宅,这在120万家庭排队等待分发住房的国家无异于杯水车薪。
数字策略之二:使数字看上去变大或变小
当某人试图说服你相信一个数字特别重要时,他所做的第一件事就是将其转换成包含相关背景的更具启发性的真相。百分率往往可以比数字本身提供更多信息。道达尔对太阳能电池板制造商日能公司投资14亿美元。你感到震惊吗?不要急于预测这家法国石油天然气巨头的可再生能源革命:这笔投资只占道达尔总资产的不到1%。
2015年,怀俄明的公路死亡人数只有145人,得克萨斯则有3516人死于车辆事故。不过,对于只有58.6万人口的怀俄明来说,每10万人的年公路死亡人数是24.7。在拥挤的得克萨斯,这个数字是12.8。
2010年,电子制造商富士康的18名员工企图自杀,其中14人死亡。这个故事成了西方报纸的头条新闻,因为富士康是苹果手机以及三星、戴尔、索尼等全球品牌一系列产品的制造商。富士康和苹果立即受到了虐待劳工和工作条件不佳的指控。这些自杀事件是一场悲剧,但它们是否意味着富士康真的存在问题?
该公司2010年的员工接近100万人,年自杀率约为十万分之一点五。中国的平均自杀率为十万分之二十二。换句话说,富士康的自杀率不到全国平均水平的7%。14起备受关注的死亡事件混淆了一个更加积极的竞争性真相。
奥巴马曾说过,在美国,浴缸导致的死亡人数超过了恐怖袭击。这种说法受到了批评,但是奥巴马并没有说错。根据国家安全委员会的数据,2013年,464名美国人在浴缸中溺死,1810名美国人在天然水域溺死,903人在床上意外窒息或者被勒死,超过3万人摔死。同年,只有3个美国人在波士顿马拉松期间死于恐怖袭击——还不到浴缸死亡人数的1/100。
脱欧事件中的数字
有一个数字决定了英国脱欧公投。这个数字是:“英国每周向欧盟提供3.5亿英镑。”英国脱欧倡导者鲍里斯·约翰逊(Boris Johnson)甚至开着一辆侧面印有这句话的“战斗巴士”环游了英国。这是一句十足的谎言。在这本关于真相的书中,我不想对此进行更多讨论。
不过,其他一些更加真实的数字得到了巧妙的使用,以便误导大众。财政大臣乔治·奥斯本(George Osborne)用一个极为惊人的数字支持了“留欧派”。财政部发布了一份预测报告,称如果脱离欧盟,英国2030年的国内生产总值将比留在欧盟低6%。奥斯本的新闻稿是这样写的:“如果英国投票退出欧盟,英国每个家庭每年将损失4300英镑。”
这有什么问题呢?首先,奥斯本的新闻稿使人觉得英国将比目前更加糟糕。实际上,财政部的预测显示,不管是否脱离欧盟,英国2030年的国内生产总值都要比现在高得多。更加完整诚实的标题应该是这样的:“英国将比它本应面临的情况糟糕一些,但它仍然会好于现在。”
还有家庭的问题。新闻稿暗示,每个英国家庭的支出将会减少4 300英镑。虽然它没有这样说,但是解读这份新闻稿的报纸的确是这样说的。不过,财政部在分析中谈论的并不是家庭收入——国内生产总值是一个完全不同的怪物,因为它包括公司投资和政府支出等因素。英国2015年有2?700万家庭,国内生产总值为1.869万亿英镑,平均每个家庭的国内生产总值超过6.9万英镑。2014—2015年的家庭可支配收入中值只有这个数字的1/3多一点,为25?700英镑。显然,家庭平均国内生产总值这一概念本身毫无意义。乔治·奥斯本及其财政部团队完全清楚所有这些事情。他们的标题是真实的,但它却是一个故意误导大众的真相。
数字策略之三:隐藏或夸大趋势
在图表上,误导者可以改变图像的标度,或者使用不是从0开始的轴线,从而改变真相。当你在有利的轴线上描绘数据时,下降趋势可以显得很平坦,不明显的增长也可以显得很突出。如果你所在地区可用医院床位的数量从15 134增加到15 326,这种1%的平凡增长在纵轴始于15 000的图像上将会成为一项令人瞩目的成就。
在尴尬的投资人会议上,你可以用累计销售图像掩盖主打产品糟糕的销售数字——你可以展示产品的总销量,而不是今年的销量。对误导者来说,累计图像的好处在于,它不会下降。你今年的累计销量不可能低于去年,除非你执行了非常宽松的退货政策。苹果总裁蒂姆·库克(Tim Cook)2013年展示了“苹果手机累计销售”图表,从而隐藏了两个季度的销售下降。他在一个月后对平板电脑销量进行了同样的操作,因为平板电脑销量也下降了两个季度。石英商业新闻网站总结道:“苹果要么不善于设计图表,要么认为你不会注意到这种区别。”
石英网上有一张可爱的曲线图,描绘了1820年以来海盗人数的下降和全球平均温度的上升。这种关联很神秘:随着海盗人数的下降,世界变得更加温暖。显然,公海犯罪行为的减少推动了洲际贸易,导致全球变暖!
这个结论当然很可笑。傻瓜都能看出来,这个逻辑应该颠倒过来:温度上升导致船上的朗姆酒蒸发,削弱了海盗的士气,促使他们从事更加本分的行业。
上面这段可笑的分析告诉我们,两组数据表面上的关联并不意味着它们存在某种因果关系。有人注意到,海滨度假区销售的冰激凌越多,溺水的人似乎就越多。这并不意味着冰激凌会导致致命的痉挛。当天气暖和时,人们喜欢吃冰激凌。当天气较好时,人们还喜欢游泳。冰激凌消费和溺水事件的增长没有因果关系,二者都是由第三个因素导致的。
数字策略之四:挑选统计量
均值还存在其他狡猾之处。许多父母关心孩子所在班级的规模,他们通常喜欢小班,因为老师有更多时间照顾每个孩子。所以,政客们热衷于证明班级的平均规模很小。不过,这并不意味着大多数孩子都在小班里。
为说明这一违反直觉的现象,想象你们镇上只有两个班级。一个班有10个孩子,另一个班有50个孩子。班级规模的均值是30,这听上去不错。不过,大多数孩子都在50人的班里。所以,平均而言,一个孩子很可能在50人的班里。更准确地说,每个孩子所在班级的人数均值是43多一点。
所以,当政客真实地谈论一个州或国家的平均班级规模时,这个数字低于一个孩子所在班级的平均人数。同样的技巧也适用于过度拥挤的监狱、火车、医院等。国家或州的均值总会低估普通人的经历。
考虑下面的谜题。当一个头发长度超过平均值的男人走进酒吧时,酒吧里的头发长度平均值却下降了。这是怎么回事?
这个谜题很简单,但它体现了一个被称为“辛普森悖论”的统计学问题。它的问题在于,同样的数字可以传达两个完全不同的真相。在回答谜题之前,让我们考虑现实中的一个例子。
2000年到2012年,调整通胀因素后的美国工资中位数上升了0.9%。这似乎是一个好消息。不过,在同一时期,高中辍学生的工资中位数下降了7.9%,高中毕业生的工资中位数下降了4.7%,大学生的工资中位数下降了7.6%,至少拥有一个学位的群体的工资中位数下降了1.2%。简单地说,美国每个经济群体的工资都下降了,但总体平均数却出现了上升。
这就是它被称为悖论的原因。
回到谜题上来。答案取决于“头发长度超过平均值”意味着什么。我们谈论的不是所有人口的“平均值”。我们是说,这个男人的头发长度超过了男性群体的平均值。当然,酒吧里有男有女,新来者的头发长度比不上女性平均值。酒吧里男性子群体的头发长度平均值增加了,女性子群体的平均值保持不变,总体平均值出现了下降。
辛普森悖论的关键是识别群体和子群体的差异。
谎言,该死的谎言和统计学
常言道:“世界上有三种谎言,谎言、该死的谎言、统计学。”在卫生、政治、投资、教育和其他许多领域,我们依靠统计量做出合适的选择。统计量不是谎言。不过,作为真相,它们比单纯的数字更容易受到操纵。
对于统计量的操纵似乎很常见,因此似乎合情合理。有人会说,如果你天真地相信某个党派组织公布的数字,那么你上当也是应该的。问题是,许多人对于数字很头疼,他们在看到数字时会停止批判性思考。如果政府部门的人拿出一组数字,我们谁会质疑它们呢?如果相互对立的智库向我们展示相互矛盾的数字,我们如何确定哪组数字代表了更大的真相呢?
我们对世界的理解取决于我们如何测量世界。我们的理解反过来又决定了我们的选票、行动和态度。数字很重要。我们一定不能失去对于数字的信任。不过,我们需要更好地解读数字,并在误导者用数字真相对我们说谎时要求他们承担责任。