別被倖存者偏差給騙了

一言以蔽之:我們常常犯下倖存者偏差這種謬誤,因為它們非常直覺。

學校和成績呈負相關的謬誤

每年下學期六月是研究所學生畢業的時候,在那之前也是求職旺季,這就是春季校園徵才,公司到學校去擺攤位,爭取應屆畢業生。

有些公司則是會提早到上學期舉辦徵才,提早錄取預計隔年的畢業生(當下是剛剛升碩二上的在學生),例如今年10月4日清華大學就舉辦了「秋徵啟航.擁抱夢想」的秋季校園博覽會,有近50家企業參與徵才。

最近在面試的時候,主管觀察到一個現象,那就是應徵者的學校和成績呈負相關,也就是說前段學校的學生成績都比較差、後段學校的學生成績都比較好。

主管想想,畢竟臺大是名校,把關比較嚴格,自然給分嚴謹;而私立大學因少子化招生困難,如果再給分不甜,估計就沒人來唸了。

噫,這理由聽起來很合理,但真的是這樣嗎?之前我們提到過,臺灣以至於全世界的各大學研究所都有成績通膨的現象,即便是頂大也不例外。那為什麼主管卻觀察學校和成績的負相關現象呢?

如果我們把全國學生的學校和成績的分佈作圖,會發現前後段學校都有、高低分成績也都有,如下圖左。但是左下角黃色區域這一群應徵者,學校和成績都不好,所以履歷就被HR刷掉了,沒有進系統讓主管看到。而右上角紅色區域的這一群學生,去更好的公司求職了,所以沒有來投履歷,主管也看不到。因此主管最後看到的履歷就只剩下中間黑點的這些學生,如下圖右,自然就會覺得學校和成績是負相關。

學校和成績分佈

倖存者偏差

另外一個很有名的例子是在第二次世界大戰期間,美國海軍檢查戰鬥機損壞的數據,製作出損壞程度與位置的分布圖,假定如下圖,於是工程師就決定強化這些有很多彈孔的地方。

戰機損壞的數據
Reference: 維基百科

統計學教授Abraham Wald卻有不同的見解,他說引擎和油箱上面彈孔很少見,不是因為子彈打不到引擎和油箱,而是戰鬥機的引擎和油箱一旦被子彈打到,就會墜落了,無法返航被工程師修理,因此戰鬥機損壞的數據表上才會都沒有引擎和油箱的彈孔。所以正確的決策,不是在彈孔最多的區域增加保護,而是在損壞最少的地方增厚裝甲。

這就是知名的Survivorship Bias(倖存者偏差),也就是推理結構是正確的,然而觀察的取樣點卻不完整,所以得到了錯誤的結論。倖存者偏差是一種非常容易犯的錯誤,因為它們非常直覺。人類的大腦傾向相信自己所看見的事物,所以就容易被部分的事實所矇蔽。