在我们所处的这个信息时代、大数据时代、算法时代,各种信息应接不暇,我们几乎被信息噪声淹没,种种问题随之产生。过去,学术噪声以华丽的辞藻和耸人听闻的话语作为伪装;今天,科学噪声则把自己包装成大数据和神奇算法的模样。TED中的数据、《纽约时报》《邮报》报道的最新发明的分析大数据的算法、医学期刊中的诊断数据,你能分辨其中哪些是信号,哪些是噪声吗?这些量化的、统计学的和计算机语言形式的噪声,就是《拆穿数据胡扯》一书主要关注的对象,两位作者花了多年时间研究打着数学和统计学的各种信息噪声,本文摘自该书,澎湃新闻经中信出版集团授权发布。
制造胡扯的工作量远小于清除胡扯的工作量,而且难度低,成本小。早在布兰多利尼提出这条原则的几年前,意大利人乌列尔·法内利就在博客中提到这个问题,原文大意是“一个白痴可以制造出你无法驳斥的胡扯”。论者、名人亚历克斯·琼斯算不上的天才,但他照样让他的那些无稽之谈(比如他认为桑迪胡克惨案是的言论和他的“比萨门”事件报道)做到皆知。他可能是一个的白痴,甚至是一个误入的白痴。
在医学领域内,关于疫苗会导致孤独症(又称自闭症)的谎言证明了布兰多利尼原理的正确性。20多年的科学研究没有提供表明疫苗会导致孤独症;事实上,有压倒性的表明这是一个谎言。但是关于疫苗的错误信息仍然存在,这在很大程度上是由于1998年英国医生安德鲁·韦克菲尔德及其同事在《柳叶刀》上发表的一项极其糟糕的研究。在那篇文章以及随后的多次新闻发布会上,韦克菲尔德的研究团队指出,一种经常与炎症性肠病同时发生的孤独症相关综合征可能与麻疹—腮腺炎—风疹三联疫苗(MMR 疫苗)有关。
韦克菲尔德的论文在那时就激起了“反疫苗”运动,引发了人们对疫苗经久不衰的恐惧,并促使麻疹界各地死灰复燃。但是,这项研究遭到了人们的怀疑,而且怀疑程度之甚在科学史上没有几项研究可以与之相比。人们投入了数以百万计的美元和无数的研究时间,反复核查它的可靠性。毫无疑问,它彻底地了信誉。
随着反对MMR疫苗导致孤独症的越积越多,以及韦克菲尔德的利益冲突出来,他的大多数联合作者对他们的研究逐渐失去了信心。2004年,其中10人正式撤回了1998年论文中的“阐释” 部分。韦克菲尔德没有签署撤回声明。2010年,《柳叶刀》彻底撤回了这篇论文。
同年,韦克菲尔德被英国综合医学委员会裁定严重渎职。他因在1998年论文上的违规行为、让病人接受不必要的侵入性医疗程序(包括结肠镜检查和腰椎穿刺),以及没有披露经济利益冲突而受到。在举行听证会后,韦克菲尔德在英国的行医执照被吊销。2011年,《英国医学》主编菲奥娜·戈德李正式宣布韦克菲尔德最初的研究是一项,并声称其中肯定存在意图,单独用能力不足这一条理由并不能解释这篇论文的诸多问题。
这些违反的行为并不是韦克菲尔德提出的孤独症与疫苗相关性的最强有力的。尽管韦克菲尔德的可能不足以证明他的结论,他对数据的处理可能很草率,他职业的行为可能非常恶劣,这篇研究论文总体而言可能确实是一个着利益冲突和结果的“精心设计的”,但理论上韦克菲尔德的说法仍有可能是正确的。事实上,他确实错了。我们知道这一点,是因为我们认真地进行了大规模的科学研究。证明孤独症和疫苗之间没有联系的并不是韦克菲尔德论文的那些缺点,而是随后的大量科学。
需要的是,研究孤独症和疫苗接种之间是否存在联系,并没有什么不妥之处。问题是,最初的研究就算往好了说也是不负责任的,而当其的结论被彻底否定后,反疫苗者了一个制药公司大的故事来。最终,韦克菲尔德执导了一部名为《疫苗黑幕》的纪录片,并在其中声称美国疾病控制与预防中心(CDC)了疫苗的安全问题。这部影片得到了的大量关注,并重新引发了对疫苗的恐慌。尽管所有的研究结果都与韦克菲尔德的相悖,也有大量的证明他的不成立,但韦克菲尔德在部分中仍然保持着可信度,而且仍然有人毫无根据地担心疫苗和孤独症之间存在某种联系。
20年后,韦克菲尔德的给健康带来了灾难性的后果。疫苗接种率在韦克菲尔德的论文发表后不久就降到了最低点,尽管现在已经开始上升,但仍低于20世纪90年代初的水平。这常的。2018年前6个月,欧洲报告了4.1万例麻疹病例,创了纪录。在曾经几乎彻底消灭了麻疹的美国,现在每年都会大规模地暴发麻疹疫情。其他疾病,比如梦见洗头掉头发流行性腮腺炎和百日咳,正在卷土重来。特别是在富裕的沿海城市,有许多美国人怀疑疫苗的安全性。最近的趋势表明,父母们开始尝试延迟接种疫苗。这一做法没有科学依据,并且会让儿童在很长一段时间内容易受到儿童疾病的。免疫系统受损的儿童尤其,他们中的许多人无法接种疫苗,因此他们的安全依赖于“群体免疫”,即周围人群接种疫苗后产生的免疫力。
综上所述,这个了科学文献中最严格的彻底质疑,并且对健康造成了严重危害,但是它不会消失。为什么疫苗和孤独症有关的如此困难?这就是布兰多利尼原理在起作用。研究人员要拆穿韦克菲尔德的观点,就必须投入比他当初提出这些论点时多得多的时间。
这个错误观点有许多特点,使得它比许多错误更持久。孤独症对父母来说非常,而且我们还不知道是什么引起的。就像那些最成功的都市传说一样,韦克菲尔德论文的描述部分既简单又扣弦:“一根针扎入孩子脆弱的身体,然后注入一种异物。在几天甚至几周内,孩子看起来都很好,然后就会突然发生严重的、通常不可逆转的行为退化。”这个故事触及了我们最深层的恐惧——对卫生和污染的恐惧,以及对我们孩子健康和安全的担忧。这个故事迎合了我们对追根溯源的渴望,也迎合了我们看到两个事件连续发生时就认为其中存在关系的特点。它还暗示我们可以通过某种方式实现。成功驳倒这样一个观点,无异于赢得一场艰苦的战斗。
胡扯不仅容易制造,也很容易。作家乔纳森·斯威夫特在1710年写道:“谎言传千里,难出门。”这句话有很多不同的版本,但我们最喜欢的是富兰克林·D.罗斯福的国务卿科德尔·赫尔说的那个版本:“还没来得及穿好裤子,谎言就已经跑过半个地球了。”我们可以想象一下:倒霉的一边费劲地把裤子从脚踝那儿拉起来,一边跌跌撞撞地沿着走廊跑过来,地追赶早已跑得无影无踪的谎言。
结合布兰多利尼原理、法内利原理和斯威夫特的观点,我们可以总结出以下:(1)制造胡扯的工作量比清除胡扯的工作量小;(2)制造胡扯对智慧的要求比清除胡扯的要求低;(3)胡扯的速度比清除工作的速度快。当然,它们只是一些箴言,听起来很有道理,给人一种“真理”的感觉,但实际上可能只是制造出了更多的胡扯。为了测量胡扯的速度,我们需要一个来搜集、存储和打包胡扯,以便进行大规模分析。脸书、推特等社交平台提供了这样的。在这些平台上发送的许多消息都是众口相传的。和胡扯并不完全一样,但它们都是有意的产物。
追溯的径主要是看哪些人分享了什么内容、是以什么样的先后次序分享的。只要有足够的系统访问权,所有的信息都很容易查到。有关危机的推文尤其重要。危机事件通常会吸引大量的注意力,这既是招致错误信息的激励因素,也是需要驳斥错误信息的重要原因。
2013年4月15日,美国波士顿马拉松赛终点发生爆炸事件。目前袭击已造成3人死亡,超100人受伤。
2013年波士顿马拉松赛就是一个类似的危机事件。袭击发生后不久,推特上就出现了一则悲惨的故事,称一名8岁女孩在这次爆炸中丧生。这个小女孩是桑迪胡克小学的学生,她参加马拉松比赛是为了纪念几个月前在的枪击案中遇难的同学。她从桑迪胡克小学枪击案中幸存下来,却死于波士顿马拉松赛爆炸案,这一又具有意味的命运促使她的故事像野火一样在推特上迅速开来。照片上的小姑娘身着荧光粉色衬衫,挂着1035号的号码牌,马尾辫在身后飘动。看到照片后,成千上万悲伤的读者纷纷回应。但也有一些读者提出了质疑。一些人指出,波士顿马拉松比赛不允许孩子参加比赛。其他人从她身上的号码牌认出她参加的是另一场比赛——乔·卡塞拉5公里赛。追踪网站Snopes和其他事实核查组织很快就了这个。那个女孩并没有死于爆炸案,她甚至没有参加那次比赛。推特用户试图纠正这一记录,有2000多条推文驳斥了这一。但这些努力都是徒劳的,超过92000人分享了这个女孩的虚假故事。一些主要新闻机构也报道了这件事。尽管人们多次试图纠正,但仍在继续。布兰多利尼又一次说对了。
脸书的研究人员也在他们的平台上观察到了类似的现象。研究人员在追踪Snopes网站调查的后发现,即使在被Snopes网站之后,虚假传言的范围也比真实传言的范围大。虚假传言的帖子在被之后大多被删除,但删除的速度不够快,不足以虚假信息的。
另外一些研究人员研究了导致大量涌现的原因。他们将论帖子与其他帖子进行了比较,发现论的影响范围要大得多。这个特点导致更正错误信息的难度特别大。乔纳森·斯威夫特对胡扯的直觉得到了充分。相比于那些胡扯的人,清理胡扯的人面临着更加不利的局面。
说真话的人还面临一个不利条件:我们获取和分享信息的方式正在迅速改变。75年来,换成了新闻推送,电视新闻换成了脸书信息,炉边聊天换成了凌晨4点发推特,这些变化为令人分心的事情、错误信息、胡扯和假新闻的迅速提供了便利。《拆穿数据胡扯》,[美]卡尔·伯格斯特龙(Carl T. Bergstrom)、[美]杰文·韦斯特(Jevin D.West)著,胡小锐译,中信出版·鹦鹉螺2022年3月。(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)
网友评论 ()条 查看