顽固的脑壳
人的思考过程往往带有各种偏差,这里讲其中常见的三种。
故事一:直觉
有个问题是这样的:某女,31岁,单身,外向,聪明伶俐。大学时主修哲学。做学生期间,非常关注种族歧视和社会不公正问题,并参与了「反核游行」。以下八种对该女的描述中,你认为哪一种最可能对(概率最高)?请按照这可能性由高到低排序。
- A. 她是小学老师;
- B. 她在书店工作,平时还练瑜伽;
- C. 她是活跃的女权主义者;
- D. 她是社工,做心理辅导;
- E. 她是「女性投票者联盟」的成员;
- F. 她是银行出纳;
- G. 她是卖保险的;
- H. 她是银行出纳,并且是活跃的女权主义者。
在很多人的答案中,H项排在了F项前面,但是没人把H项排在C项前面。
这是个很奇怪的现象,因为H项不过是F项和C项的合并,逻辑上,「既是银行出纳又是活跃的女权主义者」的H项概率绝不可能大于F项,「银行出纳」。
在日常生活中也有类似的现象。当某人向你讲述一件事时,他讲的细节越多,你越容易相信他讲的是真的。但是,细节越多,也意味着这些细节同时发生的可能性越小,所以他讲的事越不可能是真的。
这则故事常被用来说明古典概率论无法描述人类的决策过程,在起点和直觉上就可能错的离谱。这个实验是Tversky和Kahneman在1974年做的,后者后来在2002年得了诺贝尔经济学奖,前者本来应该分享这一殊荣,可惜没能活到得奖那天。
故事二:固执
某人不知道电视机的工作原理,他相信那个小盒子里肯定有许许多多小人儿,不停地在做高速运动来更换图像。这时候来了个工程师,一点点向他解释电视机的工作原理,频谱啊,发射接收啊,信号扩大啊等等。工程师讲得生动浅显,这个人也听得很认真,每一步都使劲儿点头。最后,这人觉得很满意,认为自己完全明白了电视机的工作原理。他说:「但是我觉得说来说去,也就是说那小盒子里其实只有很少几个小人儿,对吧?」
这个故事更像个笑话,不过它揭示了个道理:第一印象是很难改变的。第一印象一旦形成就很难彻底消除,以后就算接受了新信息,也往往不过是基于这第一印象进行调整。用现在流行的术语,这叫「锚效果」,第一印象就像一只锚,一旦抛下,很难撼动根本。用贝叶斯的理论说,如果这第一印象(先验概率)很强的话,要消除它或者大幅度的修正它,需要很多很强的新信息。
举个例子,法庭在进行审判的时候,如果犯罪嫌疑人面相凶狠,给法官和陪审团留下了很不好的第一印象,辩方要翻案的困难就会加倍。所以诉方通常一上来的策略就是把嫌疑人描述成一个恶棍。而嫌疑人要正装出庭不止是因为尊重法律,也是希望尽量消除在外表上的差异,避免偏差的第一印象。
这个故事转述自理论物理学家Garrett Lisi的小文章《人不是有效的推理引擎》(We Are Inefficient Inference Engines)。
故事三:谋杀
在审理谋杀案时需要大量证据,很多时候要利用逻辑推理来在这些零散的证据之间建立因果链条,也要用统计数据来增加说服力,而用错数据和推理,结果可能是致命的。
九十年代,橄榄球明星辛普森杀妻案轰动美国,各种证据都似乎证明凶手就是辛普森,而最后辛普森的「梦幻律师团」帮助他成功脱罪。林达曾用了半本书来讲这个故事,主要讲这个案子的审理程序,说明当国家机器想给个体定罪是多么容易,个体是多么无助,所以那些必要的法律程序每一步都疏忽不得。
但是林达没有讲下面这个故事。
为了证明辛普森有罪并给陪审团留下他杀妻的印象,检方举证说辛普森之前有家庭暴力行为,而「扇耳光是谋杀的前奏」。但辛普森的辩护律师说,检方不过是在误导陪审团。辩护律师说:截至1992年,美国每年有400万女性被丈夫或男友打过,但是根据联邦调查局的报告,其中只有1432人被丈夫或男友杀死,这概率大概2800分之一。怎么能用这么小的概率来推理呢?
这个辩护看起来很有说服力,但实际上完全与案件无关。问题根本不在于打过女人的男人有多大可能性杀死这女人(这概率,如上所述,是2800分之一),而在于被打过且被杀死的女人中,有多少死于打过她的人之手?这后者的概率,根据1993年的美国犯罪报告,是90%。在辛普森案中,检方从来没提起过90%这个数字,显然中了辩方的招。
换句话说,如果这女人被男人打过,但还没死,我们推断她被打死的概率是2800分之一,这没错。可如果这女人已经死了,那她的死亡就又提供了新的推理信息,给定她已经死了,那她死于打过她的人之手的概率,就是90%。
90%这概率听起来挺大,其实也正常。在美国75%以上的谋杀案中,凶手都认识死者。毕竟,无怨无仇而杀人的人,是少数。
这个推理听上去有些绕,让我再多举一个例子。
现在桌上有两把左轮枪,一把里有6颗子弹,一把里没有子弹,但你不知道哪把有子弹。你想自杀,从中挑一把朝自己开一枪,如果挑中那把没子弹的就死不了,如果挑中那把有子弹的就必死无疑。所以在没开枪之前,你死亡的概率是50%。但如果你拿起其中的一把朝自己开了一枪,发现自己没死,你就知道如果拿同一把枪再开一枪打死自己的概率是0,因为第一枪没打死自己这个事实,为你的推理提供了新的信息──你知道你拿的是空枪。
稍微再复杂一点。现在桌上只有一把左轮枪,你知道里面有一颗子弹,朝自己开一枪的话,死亡概率是六分之一。如果你打完一枪之后没死,那下一枪打死自己的概率会加大到五分之一。
但是如果你不知道这支枪里有几颗子弹或可能干脆就没有子弹,你开完第一枪没死,你就知道再开一枪打死自己的概率变小了,因为头一枪没死这件事儿,就说明了枪膛里有很多子弹的概率很小。这个逻辑推到极致就是上一段中的故事,你不知道你拿的是空枪还是上满了子弹的枪,所以在开枪前你预计的死亡概率是50%,可一旦开枪后安然无恙,你就知道这枪是空枪,再开一枪打死自己的概率是0。
我做过两学期初等概率论和统计学的助教,讲辅导课时,条件概率和贝叶斯定理很难教。这些概念和推理是合乎逻辑的,但它们和人类直觉相悖,人通常不这么思考问题,人很容易被愚弄。
那个辛普森的故事来自加州理工学院的教授Leonard Mlodinow的畅销书《醉汉走路:随机性如何左右我们的生活》(The Drunkard's Walk: How Randomness Rules Our Lives)。
尾声
当辛普森脱罪之后,几乎所有的老百姓都认定他就是杀人犯,因为证据实在太多了,但大众也都尊重法律,接受陪审团对他无罪的判决。林达认为这是文明社会的表现。而对研究人类「决策行为」的宾夕法尼亚大学的经济学家Itzhak Gilboa而言,类似的事件有不同的解读:每个人都坚信嫌疑人有罪,而每个人又都接受法庭判处嫌疑人无罪,并认为这判决遵守程序而合理,这个区别,类似于贝叶斯决策和经典统计学的区别。这也是为什么在贝叶斯理论大行其道的今天,我们依然要学习那个经典的大数定律。