國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:統計下凡(二十九)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2021/12/26 上午 10:30:15

29 檢察官的謬誤

假設檢定雖是現代做決策之一重要依據,但我們已數度強調,見到一顯著事件發生,不宜立即見獵心喜,以為虛無假設可被推翻了。反而該抱著近鄉情怯的心理,仔細檢視這樣的結果,與前提(虛無假設)之成立或不成立,究竟有多大關連?若(自以為)依賴統計,過度重視顯著事件,有時會產生所謂“檢察官的謬誤”(prosecutor’s fallacy)

來看個可能發生的情況。設有某法院審理某刑事案件,在無罪推定的前提下,虛無假設自然取為H0:被告無辜。假設開庭時,檢察官提出一疑點,有某現象D發生了,且指出若H0為真,則現象D發生之機率僅為百萬分之1,一個極小的p-值。此時被告是否該俯首認罪?等等!現象D的發生,與H0為真之關係大嗎?說不定不管H0是否為真,D發生之機率都是百萬分之1。此時被告的律師,若有概念的話,不妨反問當D發生時,H0為真之機率又是多少?這其實是另一條件機率,須有更多的資訊才能求得。由於通常條件機率P(A|B)P(B|A),故

P(D|H0)=10-6

不表亦有

P(H0|D)=10-6

因而檢察官企圖讓人相信的(底下H0cH0之餘集,在此即被告並非無辜)

P(H0c|D)=1-P(H0|D)=1-10-61

只能說是憑空冒出。例如,如前所述,若DH0獨立,且P(D)=10-6,則當然有P(D|H0)=P(D)=10-6,但P(H0|D)=P(H0),可就不必然等於10-6了。就算D之發生,的確屬於顯著事件,但若根本與H0是否為真毫不相干,則提出D發生有何用?魚目混珠而已。只是在法庭上(當然政壇上也不少),不少人屢會有意或無意地將P(D|H0)P(H0|D)二者混淆,有時冤獄便因而產生了。由於這套利用條件機率的詭論,偶被檢察官引用來做佐證,故才會被稱為“檢察官的謬誤”。鑑於統計有時成了冤獄的幫凶,遂有人提出“靠統計數字定罪的危險”之警告,頗令統計人難堪。底下便以著名的“莎莉克拉克案”(The Sally Clark case),來說明在法庭,若要引用統計來當證據,須格外謹慎。而另一方面,在辯論攻防時,若見到有人引用統計,也須提高警覺,不要迅即被“科學”說服。資料取自Wikipedia(維基百科)

英國的莎莉克拉克(Sally Clark1964-2007,本名Sally Lockyer,自結婚後以夫姓Clark取代娘家的姓Lockyer),是家中的獨生女,她父親是位資深警官,母親是位美容師。1990年,莎莉與同樣是初級律師(solicitor)的史提夫克拉克(Steve Clark)結婚。家庭及事業,一切看起來都很美好。19969月,他們的老大誕生。這個健康的男嬰,不幸卻在當年12月,11週大時,在家中猝死(Sudden cardiac death,縮寫SCD,指突然的死亡)。莎莉好不容易才從悲傷中復原,於隔年(1997)11月,又生了一個兒子,以為可開始過新生活了。豈料8週後,19981月,嬰兒又在家中猝死,兩次兒子猝死,都是莎莉一人在家。只是人世的慘痛,豈僅是失去雙子?已難再從悲傷中復原的莎莉,面臨殺嬰的控訴。

起訴的檢察官,並沒有莎莉行凶的直接證據。但他就是認為,接連兩個嬰兒猝死,極不尋常,應為顯著事件。憑其直覺,檢察官完全不相信嬰兒猝死症(Sudden infant death syndrome,縮寫SIDS,指嬰兒突然死亡,不論從其病史、身體檢查,或研究調查,都無法發現死因),便是此二事件發生的真正原因。為了說服陪審團,這絕不是猝死,檢察官找來梅鐸(Sir Roy Meadow1933-,他是位爵士)作證。梅鐸是位夙負盛名的小兒科醫生(paediatrician),且上法庭作證的經驗豐富,他以“擅長”利用機率來佐證著稱。

梅鐸以簡易的方式,向陪審團說明,一家有2嬰兒接連猝死的機率有多小。他說同一家庭有兩個小孩死於SIDS的機率,為7,300萬分之1。梅鐸承認這麼微小機率的事件,並不表示就不會發生。但他指出,這種意外,每1百年才會有1次。搞不清楚7,300萬分之1到底多小的人,於聽到百年1次,立即就懂了。人生不滿百,百年發生1次的事件,怎會在有生之年見到?因而此顯然不會是猝死。這是一記重磅!梅鐸還說,全英國兩個小孩的家庭,共有1,500萬個。對照7,300萬分之1的機率,這麼一聽又更明白了。不會發生!又是一記重磅!既然不可能是猝死,“真相”便立即浮出了。陪審團接受梅鐸的證詞。1999年,莎莉被判無期徒刑(life imprisonment),並於2000年入獄。直到20031月,經第二次上訴後,基於死嬰之新的病理報告出爐,最高法院改判莎莉無罪。只是遲來的正義,對莎莉已不具意義了。出獄後,莎莉一直處於精神不佳的狀態,有如槁木死灰,終日酗酒,茫然度日。20073月,她因酒精中毒,死於家中。

我們先來看梅鐸的數據之由來。梅鐸宣稱,對一如克拉克這種家境良好且不抽煙的家庭,會發生1件嬰兒猝死(cot death)的機率為1/8,543。因此這種家庭會發生2件嬰兒猝死的機率,為前述值之平方,即

(1/8,543)2=1/72,982,849

這是7,300萬分之1的機率產生之由來。那百年1次又是如何來的?梅鐸說,全英國每年約有70萬個新生兒,他將7,300除以70,得104.…,取近似值100。應是104年發生1次,他還少算一些呢!只是將7,300除以70,不知究竟代表什麼?

我們不能期望陪審團、檢察官或法官的數學、機率及統計,能有多好,那梅鐸的功力如何呢?身為醫生,能被封為爵士,總不至於浪得虛名吧!神秘的1/8,543這一嬰兒猝死機率,雖不知如何誕生,我們就先接受好了。但將兩個1/8,543相乘,就毫無根據了。同一家庭的2嬰兒先後猝死,真是獨立事件嗎?這對未曾謀面的兄弟2人,由於遺傳之關係,說不定會有類似的基因缺陷。再加上照顧方式,及生長環境皆類似等因素,一家庭中的2猝死事件,絕不該在沒有依據下,就視為獨立。無論如何,不管三七二十一,就將兩機率值相乘,是很輕率的。不該是一個受過水準以上機率訓練的人,所會犯的錯。因此機率7,300萬分之1,應是一極被低估下的值。至於因機率7,300萬分之1,且每年約有70萬新生兒,將二者相除,就得到同一家庭兩件嬰兒猝死案,百年才會有一樁,這更是莫名其妙了。兩數字可以相除,但不表具有意義。只是既然有這麼多統計上的缺失,英國眾多統計學者,難道都不吭聲嗎?

首先,如我們之前所一再強調的,這裡犯了“檢察官的謬誤”。因就算7,300萬分之1的機率為正確,也不表在2嬰兒猝死下,莎莉無辜的機率也是7,300萬分之1。這跟若某A君中樂透彩頭獎,不表他必是靠作弊得獎的情況類似。這是另一條件機率,要有更多的資訊,才能估算。另外,英國皇家統計學會(Royal Statistical Society,縮寫RSS),倒也沒有袖手旁觀,只是動作相當緩慢。學者總是這樣,不愛蹭熱度,在確定真有必要,且有極大的把握前,不會輕易出手。事實上,他們於200110(莎莉入獄後隔年),發表一公開的聲明,對本案裡的“法庭誤用統計”(misuse of statistics in the courts),表示關切。並說“7,300萬分之1的機率毫無統計依據”(no statistical basis for the 1 in 73 million)20021月,RSS還寫信給上議院大法官(Lord Chancellor),明確指出7,300萬分之1的計算是錯的(the calculation leading to 1 in 73 million is invalid)

再過3年,2005年,英國醫學總會(General Medical Council,縮寫GMC),鑑於梅鐸曾多次在法庭上擔任專家證人,卻提供錯誤資訊,因而數度入人於罪,撤銷了他的醫師執照。雖經上訴後,隔年梅鐸重新拿回其執照,但名聲已毀了一大半了。最後,2004年,索爾福德大學(University of Salford)的數學教授希爾(Ray Hill),在期刊Paediatric and Perinatal Epidemiology上,發表一篇論文。他依據英國的統計資料,推導出1嬰兒猝死的機率約為1/1,300,而非1/8,543那麼小。他並且估計出,一家庭若有1嬰兒猝死,則會再有1嬰兒猝死的機率,將提高510倍。看來梅鐸醫生自以為能善用統計,其實犯了不少錯,卻一直毫無所覺。統計!多少人假統計之名!

201675日,中國時報有則標題是“16年前性侵案 DNA揪惡狼”之報導;相隔3天,同年78日,聯合報亦有則有關DNA(deoxyribonucleic acid之縮寫,去氧核醣核酸)比對的報導,標題是“警方如何鎖定爆炸案嫌犯?根據乘客傷勢”。今日警方屢能利用比對DNA來破案,福爾摩斯若復出,想必會嘆為觀止。

DNA比對,成了今日破案的利器。而既然能讓16年前的犯案者,無所遁形,則不足為奇,也當然有平反冤獄的時候。有些人已含冤坐了多年牢,本再也不相信什麼老天有眼,結果拜DNA比對之賜,終於還了清白。由於有關DNA比對立功的報導,一再出現,使人們不禁以為,一旦祭出DNA比對,眾人便不得不臣服。大致是這樣沒錯,只是在運用時,如前兩則新聞內容所顯示的,仍需有其他佐證。即不能光是比對吻合,就立即以為案子破了,找到真相。若過度執著於DNA比對的高吻合率,有時便難免犯下“檢察官的謬誤”。底下給一實例。

20166月號的Scientific American (Volume 314Issue 6),有一篇標題為“When DNA Implicates the Innocent”的文章,作者是Peter Andrey Smith。由林雅玲譯的“DNA證據牽連無辜?”一文,則刊登在下一個月,台灣發行的“科學人”(20167月號(No.173))。在該文中,先舉一DNA比對,引導錯誤的案例。201212月,美國警方根據DNA的比對,指控一位名叫安德森(Lukis Anderson)的遊民,涉嫌矽谷富豪庫姆拉(Raveesh Kumra)的謀殺案。此控訴若被判有罪,最重是死刑。只是處在美國社會底層的安德森,與此案根本毫不相干,他有無懈可擊的不在場證明。在11月庫姆拉被謀殺的那晚之前,安德森便因醉酒且近乎昏迷(drunk and nearly comatose),一直待在醫院接受治療。只是自以為依科學辦案的警方,見多了狡猾的嫌犯,當然不理會此對安德森有利的證據。那這件飛來橫禍,究竟是怎麼產生的?安德森的辯護律師團發現,安德森的DNA,是在事發之後,隨著醫護人員進入庫姆拉家中。那幾位醫護人員,在當天稍早曾治療過安德森,然後在3個多小時後,不經意地把安德森的DNA,帶到命案現場,並留在那裡,成為安德森涉案的“鐵證”。DNA會移動?居然有這種事!有些人感到不可思議。其實倒也不必太驚訝,因我們已多次舉出不可能卻發生的事件了。

上述文章中指出:

DNA分析以統計模型做出預測,比起其他法醫技術,更為明確與客觀。(DNA analysis is more definitive and less subjective than other forensic techniques because it is predicated on statistical models.)

一般而言,利用統計,當然比其他方法更明確且更客觀,這是無庸置疑的。但該文要講的重點是:

DNA檢驗和其他證據一樣,透露的僅僅是完整案件的其中一個面向。…。如果我們過度依賴這個方法,以及在檢視DNA證據時,缺乏適度的質疑,誤判案例早晚會發生。例如,生物樣本可能分解,或遭到污染,而法官和陪審團可能曲解統計機率(statistical probability)。甚至,就像安德森一案所揭露的,皮膚細胞也可以“移動”。…。一個人攜帶的衣物,就算只是碰到另一人的脖子,都可能把後者的DNA,轉移到此人從未接觸過的物體上。…。DNA的轉移究竟有多常引發錯誤的指控,目前仍未知。

DNA的比對類似,統計裡的假設檢定,此一科學的思維與方法,的確常能讓人們將事情看得更清晰,因而有助於提高決策品質。但切記它並非萬無一失。若“過度依賴,而缺乏適度的質疑”,則誤判的發生,便絕非偶然。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (8JXC
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2022/1/13 下午 01:35:57

2003/10/20起第 6328916 位訪客
*