WFU

2023/11/09

《常識統計學》(Standard deviation)數據經常欺騙我們


作者:朱健豪 醫師




對於數據應當保持懷疑

人們用數據欺騙我們,我們也經常用數據欺騙自己。

我們生來便有以某種方式理解周圍世界的傾向——發現模式,並且編造出解釋這些模式的理論。我們低估了毫無理由的隨機事件生成幸運或不幸模式的容易程度。

即使能夠得到比較充足的資訊,我們也不會永遠留意數據的偏差和無相關性,或者科學研究的缺陷和誤導性。

現在,面對豐富的資料,研究人員通常不會花費太多的時間區分優質資料和垃圾,或者區分合理分析和垃圾科學。更糟糕的是,我們常常不假思索地認為,我們處理大量資料永遠不會出錯。


辨別數據的4個盲點

數據理想上是為了讓我們生活上有所指引,但無論是有心或無意的採納不恰當的數據,可能會讓我們付出慘痛的代價。

在相信任何數據前,以下4點是我們必須提醒自己的:

1. 我們容易受到模式引誘

人類天生擅長找出模式,一但找出數據背後的模式,我們便深信不已,開始緊盯著支持模式的數據,忽略任何相佐的證據。

當連勝時,我們更加確信自己觀察到的模式是正確的;但在連敗時,我們卻會找出一堆藉口,以便支撐自己的信仰,畢竟,我們相信這就是事實。


2. 忽略了幸存者偏差


絕大部分容易取得的數據,都屬於回朔性的資料。這樣的資料問題在於:看不到淘汰者發生了什麼事。

這樣的數據只能檢視過往,無從預測未來。不能從後視鏡向前看,但偏偏我們都都喜歡這樣做。


3. 充滿障眼法的圖表


視覺化的圖表可以清楚呈現數據要告訴我們的現象,但更可以混淆視聽、幾可亂真。


留意那些間隔不固定、缺乏0點或是兩個縱軸的圖像,對方很可能要欺騙你。



4. 神槍手謬誤


即便是一筆雜亂無章的數據,想要從中找到解釋的人,最終一定有辦法找到解釋。


假冒的神槍手會先射出一堆子彈,找出命中最多的位置再畫出目標,同時抹掉其餘彈孔。


同樣的,我們應該先提出理論,接著使用數據來驗證理論,就像真正的神槍手,先畫出目標再開槍。



後記

在這個講求數據的年代,我們被各種數據所淹沒,學會去懷疑各種提出的數據,跟如何運用數據一樣重要。

提出數據的一方無非是為了證明己身觀點,只要有心,任何人都能從亂數中找出一定模式,從而印證自身觀點。

為了避免被數據所誤導,看到任何數據時,務必試問自己:眼前呈現的數據遺漏了哪些部份?這些數據是否只能回推過往或是極為特定的情境,無法用預測未來或是生活其他場景?

同時也要自我警惕:從數據中發現理論不是新鮮事,唯有把理論放在其他數據內才能獲得驗證。

缺乏理論的資料僅是資料而已,缺乏資料的理論僅是理論而已。


對於數據應當保持懷疑


以上資訊如果對你有幫助的話,歡迎分享給你的親朋好友們或留言告訴我。