國立高雄大學統計研究所-心在南方

:::

:::

主題：頻率學派與貝氏學派(二)

發表者：黃文璋　Email:huangwj@nuk.edu.tw

日期：2016/10/22 上午 01:27:51

2 貝氏定理

衛生局至某大學檢驗學生是否罹患某疾病。為了國民健康，再加上有業績壓力，衛生局大力鼓吹學生前來受檢，強調檢驗迅速、無害，且免費。檢驗的後續處理為何？有學生問。這樣大費周章，總不至於檢驗完就算了。衛生局指出，檢驗結果有正及負兩種反應，若呈正反應，表示很可能有病，須至醫院接受進一步的檢查；若呈負反應，表應沒病，可以安心了。有病宜及早發現並治療是沒錯，但學生多半怕麻煩，若特地到醫院，被折騰一番後，卻告訴你沒病，未免虧大了。衛生局說明檢驗可靠度為90%，誤判機率不大。有學生想了解可靠度90%的意思。若有病，則有0.9的機率檢驗呈正反應；若無病，則有0.9的機率檢驗呈負反應，衛生局坦白答覆。一個人會有病的機率是多少？發問的學生顯然是個行家。每5,000人裡，差不多有1人罹病，衛生局查出過去的資料。

該不該去檢驗？一群實事求是的學生，就教於某統計研究所的學生。統計入世，有學以致用的機會得把握住。這位研究生，遂以淺顯的方式，提出下述分析，供眾人參考。

依衛生局的資料，不妨假設每人有病的機率為1/5,000=0.0002，且學生就剛好有5,000人。則其中平均1人有病。由於誤判的機率為0.1，則那平均的4,999位無病者中，平均將有

4,999×0.1=499.9(人)

檢驗呈正反應；至於平均的那1位有病者，平均將有

1×0.9=0.9(人)

驗檢呈正反應。故共有

499.9+0.9=500.8(人)

檢驗呈正反應。其中平均只有0.9人真正有病(有病那人有0.1的機率，檢驗呈負反應，如此便不在500.8個呈正反應的人裡)。因此，平均而言，任一位檢驗呈正反應者，有病的機率為

0.9/500.8≈0.001797，

不到1/500。看到這麼小的機率值，可能有不少學生想打退堂鼓，不接受檢驗了。

說什麼誤判機率不大，怎會差這麼多？不是宣稱檢驗有90%的可靠度？何以卻如此不可靠？學生很不解。要知檢驗的可靠度雖不算低，但關鍵在平均每5,000人，才1人有病，此乃一罕見疾病。而看起來不算大的10%誤判率，卻造成5,000人中，約有500個正反應(實際平均有500.8個)。這約500位被懷疑有病者，其中才約1位(實際平均有0.9位)真正有病。因此在呈正反應下，有病的機率值約為1/500(實際為0.9/500.8)，比大部分的人，以為有病機率該是0.9，確實小太多。

由於有這類事先宣稱儀器的正確率，與檢驗後正確的有病率，差異可能很大的現象，不少人認為醫生都該懂些機率。而且對於罕見疾病，診斷須更加謹慎，否則極易誤判。明白這其中的奧妙，就不難理解，何以不時有被醫生宣判已無妙手可回春的病人，後來卻痊癒出院，且長久活得好好的。不過對這種判斷錯誤，醫生並不擔心醫術被質疑，他們只要歸之於奇蹟出現就好了。家屬高興都來不及，豈會去怪醫生?

我們再來看，若檢驗呈負反應會如何？仿上述討論重做一遍。每5,000人中，平均有4,999人無病。而平均有

1×0.1+4,999×0.9=0.1+4,499.1=4,499.2(人)

檢驗呈負反應。其中平均有4,499.1人無病。因此，在檢驗呈負反應下，無病的機率為

4,499.1/4.499.2≈0.999977773，

相當接近1。只是這並不太稀奇，因在檢驗前，任一人無病的機率便已高達

4,999/5,000≈0.9998，

而當檢驗呈負反應後，無病的機率，只不過略高些而已。

附帶一提，當檢驗呈正反應時，無病的機率為

499.9/500.8≈0.9982，

比檢驗前無病的機率0.9998略低些，但仍很接近1；而當檢驗呈負反應時，有病的機率為

0.1/4,499.2≈0.00002223，

比檢驗前，有病的機率0.0002低，即更接近0。另外，即使檢驗可靠度提高到99%，即誤判機率僅有1%，則在檢驗呈正反應下，有病的機率為

0.99/50.98≈0.0194，

約1/50，依然不大。關鍵仍然是有病的機率0.0002著實太小了。我們再看若更改有病的機率，會有什麼改變。先將有病的機率提高為0.002，則在檢驗可靠度90%下，當檢驗呈正反應下，有病的機率為

0.9/50.8≈0.0177，

還是很低。即使有病的機率提高至0.2，則在檢驗可靠度90%下，當檢驗呈正反應下，有病的機率為

0.9/1.3≈0.692，

仍比宣稱的檢驗可靠度90%小不少。

既然儀器並非完全可靠，那檢驗是否沒啥大用？並非如此。每人身體狀況其實大不相同，在檢驗前，由於沒有其他資訊，遂只好假設每人有病的機率相等，即都是0.0002。此稱為事前機率，或先驗機率(prior probability)。檢驗後，若呈正反應，則有病的機率改變了，成為0.9/500.8≈0.001797，此稱為事後機率，或後驗機率(posterior probability)。事後機率，升高到約為原先的9倍，顯然不能說檢驗沒用。

在上述討論中，我們看到機率值會變，這是機率的特性。當有新的資訊，或者說給定某條件，機率往往隨之而變，這便是所謂條件機率(conditional probability)。對二事件(event)A，B，且P(B)≠0，在給定B之下，A的條件機率P(A|B)之定義為

(1) P(A|B)=P(A∩B)/P(B)，

其中符號“∩”表交集。要注意P(A|B)與P(B|A)意義不同，且通常也不相等。後者當P(A)≠0時，定義為

(2) P(B|A)=P(A∩B)/P(A)。

由(1)及(2)兩式，得

(3) P(A∩B)=P(A|B)P(B)=P(B|A)P(A)。

在前述檢驗的例子，衛生局提供的資訊，是下述二條件機率：

P(正反應|有病)=0.9，及P(負反應|無病)=0.9，

但我們較有興趣的，卻是底下之條件機率：

P(有病|正反應)，及P(無病|負反應)。

不一樣的條件機率，當然不能自動以為仍皆是0.9。

底下來看，除了之前直觀的方式外，如何以較數學，亦即較簡潔且較一般的方式，來推導出事後機率。首先，如同在教科書裡常見的，對一隨機試驗，我們以Ω表樣本空間(sample space)，Ω即為所有可能觀測到的結果之集合。我們常提到事件，事件又是什麼？Ω的一子集合，便稱為一事件。對一事件B，其餘集(complement)以B^c表之，即在Ω中，但不在B中的元素之集合。顯然B與B^c的交集為空集合(通常以符號∅表之)，而這樣的兩個集合，稱為互斥(disjoint)。又B∪B^c=Ω。其中符號“∪”表聯集。利用機率函數的性質，及(3)式，我們有

(4) P(A)=P(A∩B)+P(A∩B^c)=P(A|B)P(B)+P(A|B^c)P(B^c)。

(2)式及(4)式，便導致

(5) P(B|A)=P(A∩B)/P(A)=P(A|B)P(B)/[P(A|B)P(B)+P(A|B^c)P(B^c)]。

從P(A|B)，如何得到P(B|A)？實務上常有此需求。由(5)式知，除了P(A|B)外，尚要知道P(A|B^c)，及P(B)才行。至於P(B^c)，一旦有了P(B)，立即可得P(B^c)=1-P(B)。

在前述檢驗的例子裡，以A，B二事件，分別表正反應，及有病。則事件A^c便是負反應，事件B^c便是無病。由於例中假設P(A|B)=P(A^c|B^c)，不妨以p表之。又以q表P(B)，則P(B^c)=1-q，且P(A|B^c)=1-p。如此(5)式導致

(6) P(B|A)=pq/[pq+(1-p)(1-q)]。

底下便以著名的典故“曾參殺人”，來看(6)式之一應用。首先，在“戰國策”“秦策二”中記載：

昔者曾子處費，費人有與曾子同名族者而殺人。人告曾子母曰“曾參殺人。”曾子之母曰“吾子不殺人。”織自若。有頃焉，人又曰“曾參殺人。”其母尚織自若也。頃之，一人又告之曰“曾參殺人。”其母懼，投杼逾牆而走。

曾參(西元前505-435年)比孔子(西元前551-479年)小46歲。假設跟孔子一樣，曾參“十有五而志於學”，且隨即拜入孔子門下，則那時孔子便已61歲了。即曾參是孔子晚年才收的弟子。曾參律己很嚴，“論語”“學而篇”裡，那句“吾日三省吾身”，就是他講的。他被稱為“曾子”，又有“宗聖”之稱，因孔子有關文化道統的思想，大部分是靠他傳承下來。曾參事母至孝，“二十四孝”中，有一則“齧指痛心”，便是關於他的孝順故事。這樣的人品，其母當然對他相當有信心。正在織布的曾母，聽到有人跑來告訴她兒子殺人，謠言止於智者，一點都不相信，神色自若地繼續織布，並回說“我兒子不會殺人”。過一會兒，又有人來告訴她兒子殺人，曾母仍神色自若地繼續織布，但沒說話了。再沒多久，第三人來說她兒子殺人，曾母便害怕地丟下織布的梭子，跳過圍牆逃走，信心崩潰了。

現以A，B分別表事件“通報殺人”，及“曾參殺人”。且設P(A|B)=P(A^c|B^c)=p，P(B)=q。則由(6)式，得

(7) P(曾參殺人|通報殺人)=pq/[pq+(1-p)(1-q)]。

曾參生長在春秋時代，是後世史學家所稱的亂世。為了自衛等原因，誰都無法絕不可能殺人。但他一向品德高尚，不會惹事生非，殺人的機率應很低。不妨就假設q=0.001，這是事前機率。另一方面，會來跟曾母通風報信的，應多半是鄉親熟人，沒什麼必要騙她，因此他們的通報，可信度應不低。但說不定看錯人，或由於輾轉誤傳，通報並非必然百分之百正確。假設p=0.9。即

P(通報殺人|曾參殺人)=P(通報未殺人|曾參未殺人)=0.9。

將p=0.9，及q=0.001代入(7)式，便得曾母於獲得“曾參殺人”的通報後，認為兒子會殺人的機率(事後機率)

q₁=0.0009/(0.0009+0.0999)=1/112≈0.00893。

雖從0.001提高了不少倍，只是仍不到百分之1。這麼小的機率，曾母自然不太在乎。待第二人來通報後，前述q₁成為新的曾母以為“曾參殺人”的事前機率，至於p仍是0.9。將p=0.9，及q₁=1/112代入(7)式中的p，q，便得新的曾母認為兒子會殺人的機率(新的事後機率)

q₂=3/40=0.075。

機率仍不算太大，但再度提高了好幾倍。所以曾母雖然繼續織布，但“我兒不殺人”的大話，就閉口不說了。待第三人來通報曾參殺人後，曾母認為兒子會殺人的機率(更新的事後機率)，增至

q₃=27/64=0.421875。

此時發生的機率，可一點都不能說小了。曾母遂覺得大事不妙，於是三十六計，走為上策。我們再來看，假若曾母未逃，且還有第四人，前來通報“曾參殺人”，那會如何？可得

q₄=243/280=0.868，

這麼大的機率，曾母鐵定更要嚇壞了。

一旦講到條件機率，便不能不介紹著名的“貝氏定理”(Bayes' theorem)，這是(5)式的推廣。此定理一般歸之於英國牧師貝氏(Thomas Bayes，1702-1761)最先提出。但貝氏其實並未明確地給出此定理，只討論若干與它相關的問題，著名的天文學家及數學家，有法國牛頓之稱的拉普拉斯(Pierre-Simon，Marquis de Laplace，1749-1827)，才是第一位完整給出此定理之敘述者。