國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:頻率學派與貝氏學派(二)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2016/10/22 上午 01:27:51

2 貝氏定理

衛生局至某大學檢驗學生是否罹患某疾病。為了國民健康,再加上有業績壓力,衛生局大力鼓吹學生前來受檢,強調檢驗迅速、無害,且免費。檢驗的後續處理為何?有學生問。這樣大費周章,總不至於檢驗完就算了。衛生局指出檢驗結果有正及負兩種反應,若呈正反應,表示很可能有病須至醫院接受進一步的檢查;若呈負反應,表應沒病,可以安心了。有病宜及早發現並治療是沒錯,但學生多半怕麻煩,若特地到醫院,被折騰一番後,卻告訴你沒病,未免虧大了。衛生局說明檢驗可靠度為90%,誤判機率不大。有學生想了解可靠度90%的意思。若有病,則有0.9的機率檢驗呈正反應;若無病,則有0.9的機率檢驗呈負反應,衛生局坦白答覆。一個人會有病的機率是多少?發問的學生顯然是個行家。每5,000人裡,差不多有1人罹病,衛生局查出過去的資料。

該不該去檢驗?一群實事求是的學生,就教於某統計研究所的學生。統計入世,有學以致用的機會得把握住。這位研究生,遂以淺顯的方式,提出下述分析,供眾人參考。

依衛生局的資料,不妨假設每人有病的機率為1/5,000=0.0002,且學生就剛好有5,000人。則其中平均1人有病。由於誤判的機率為0.1,則那平均的4,999位無病者中,平均將有

4,999×0.1=499.9()

檢驗呈正反應;至於平均的那1位有病者,平均將有

1×0.9=0.9()

驗檢呈正反應。故共有

499.9+0.9=500.8()

檢驗呈正反應其中平均只有0.9人真正有病(有病那人有0.1的機率檢驗呈負反應,如此便不在500.8個呈正反應的人裡)因此,平均而言,任一位檢驗呈正反應者,有病的機率為

0.9/500.80.001797

不到1/500。看到這麼小的機率值,可能有不少學生想打退堂鼓,不接受檢驗了。

說什麼誤判機率不大,怎會差這麼多?不是宣稱檢驗有90%的可靠度?何以卻如此不可靠?學生很不解要知檢驗的可靠度雖不算低但關鍵在平均每5,000人,才1人有病,此乃一罕見疾病而看起來不算大的10%誤判率,卻造成5,000人中,約有500個正反應(實際平均有500.8)。這約500位被懷疑有病者,其中才約1(實際平均有0.9)真正有病。因此在呈正反應下,有病的機率值約為1/500(實際為0.9/500.8),比大部分的人,以為有病機率該是0.9,確實小太多。

由於有這類事先宣稱儀器的正確率,與檢驗後正確的有病率,差異可能很大的現象,不少人認為醫生都該懂些機率而且對於罕見疾病,診斷須更加謹慎,否則極易誤判。明白這其中的奧妙就不難理解,何以不時有被醫生宣判已無妙手可回春的病人,後來卻痊癒出院,且長久活得好好的不過對這種判斷錯誤,醫生並不擔心醫術被質疑,他們只要歸之於奇蹟出現就好了。家屬高興都來不及,豈會去怪醫生?

我們再來看,若檢驗呈負反應會如何?仿上述討論重做一遍。每5,000人中,平均有4,999人無病。而平均有

1×0.1+4,999×0.9=0.1+4,499.1=4,499.2()

檢驗呈負反應。其中平均有4,499.1人無病。因此,在檢驗呈負反應下,無病的機率為

4,499.1/4.499.20.999977773

相當接近1。只是這並不太稀奇,因在檢驗前,任一人無病的機率便已高達

4,999/5,0000.9998

而當檢驗呈負反應後,無病的機率,只不過略高些而已。

附帶一提,當檢驗呈正反應時,無病的機率為

499.9/500.80.9982

比檢驗前無病的機率0.9998略低些,但仍很接近1;而當檢驗呈負反應時,有病的機率為

0.1/4,499.20.00002223

比檢驗前,有病的機率0.0002低,即更接近0。另外,即使檢驗可靠度提高到99%,即誤判機率僅有1%,則在檢驗呈正反應下,有病的機率為

0.99/50.980.0194

1/50,依然不大。關鍵仍然是有病的機率0.0002著實太小了。我們再看若更改有病的機率,會有什麼改變。先將有病的機率提高為0.002,則在檢驗可靠度90%下,當檢驗呈正反應下,有病的機率為

0.9/50.80.0177

還是很低。即使有病的機率提高至0.2,則在檢驗可靠度90%下,當檢驗呈正反應下,有病的機率為

0.9/1.30.692

仍比宣稱的檢驗可靠度90%小不少。

既然儀器並非完全可靠,那檢驗是否沒啥大用?並非如此。每人身體狀況其實大不相同,在檢驗前,由於沒有其他資訊,遂只好假設每人有病的機率相等,即都是0.0002。此稱為事前機率,或先驗機率(prior probability)。檢驗後,若呈正反應,則有病的機率改變了,成為0.9/500.8≈0.001797,此稱為事後機率,或後驗機率(posterior probability)。事後機率,升高到約為原先的9倍,顯然不能說檢驗沒用。

在上述討論中,我們看到機率值會變,這是機率的特性當有新的資訊,或者說給定某條件,機率往往隨之而變這便是所謂條件機率(conditional probability)。對二事件(event)AB,且P(B)≠0,在給定B之下,A的條件機率P(A|B)之定義為

(1) P(A|B)=P(AB)/P(B)

其中符號表交集。要注意P(A|B)P(B|A)意義不同,且通常也不相等。後者當P(A)≠0時,定義為

(2) P(B|A)=P(AB)/P(A)

(1)(2)兩式,得

(3) P(AB)=P(A|B)P(B)=P(B|A)P(A)

在前述檢驗的例子,衛生局提供的資訊,是下述二條件機率:

P(正反應|有病)=0.9,及P(負反應|無病)=0.9

但我們較有興趣的,卻是底下之條件機率:

P(有病|正反應),及P(無病|負反應)

不一樣的條件機率,當然不能自動以為仍皆是0.9

底下來看,除了之前直觀的方式外,如何以較數學,亦即較簡潔且較一般的方式,來推導出事後機率。首先,如同在教科書裡常見的,對一隨機試驗,我們以Ω表樣本空間(sample space)Ω即為所有可能觀測到的結果之集合。我們常提到事件,事件又是什麼Ω的一子集合,便稱為一事件對一事件B,其餘集(complement)Bc表之,即在Ω但不在B中的元素之集合。顯然BBc的交集為空集合(通常以符號表之),而這樣的兩個集合,稱為互斥(disjoint)。又BBc。其中符號表聯集利用機率函數的性質(3)式,我們有

(4) P(A)=P(AB)+P(ABc)=P(A|B)P(B)+P(A|Bc)P(Bc)

(2)式及(4)式,便導致

(5) P(B|A)=P(AB)/P(A)=P(A|B)P(B)/[P(A|B)P(B)+P(A|Bc)P(Bc)]

P(A|B),如何得到P(B|A)?實務上常有此需求。由(5)式知,除了P(A|B)外,尚要知道P(A|Bc),及P(B)才行。至於P(Bc),一旦有了P(B),立即可得P(Bc)=1-P(B)

在前述檢驗的例子裡,以AB二事件,分別表正反應,及有病。則事件Ac便是負反應,事件Bc便是無病。由於例中假設P(A|B)=P(Ac|Bc),不妨以p表之。又以qP(B),則P(Bc)=1-q,且P(A|Bc)=1-p。如此(5)式導致

(6) P(B|A)=pq/[pq+(1-p)(1-q)]

底下便以著名的典故曾參殺人,來看(6)式之一應用。首先,在戰國策秦策二中記載:

昔者曾子處費,費人有與曾子同名族者而殺人。人告曾子母曰曾參殺人。曾子之母曰吾子不殺人。織自若。有頃焉,人又曰曾參殺人。其母尚織自若也。頃之,一人又告之曰曾參殺人。其母懼,投杼逾牆而走。

曾參(西元前505-435)比孔子(西元前551-479)46歲。假設跟孔子一樣,曾參十有五而志於學,且隨即拜入孔子門下,則那時孔子便已61歲了。即曾參是孔子晚年才收的弟子。曾參律己很嚴,論語學而篇裡,那句吾日三省吾身,就是他講的。他被稱為曾子又有宗聖之稱,因孔子有關文化道統的思想,大部分是靠他傳承下來。曾參事母至孝,二十四孝中,有一則齧指痛心便是關於他的孝順故事。這樣的人品,其母當然對他相當有信心。正在織布的曾母,聽到有人跑來告訴她兒子殺人,謠言止於智者,一點都不相信,神色自若地繼續織布,並回說我兒子不會殺人。過一會兒,又有人來告訴她兒子殺人,曾母仍神色自若地繼續織布,但沒說話了。再沒多久,第三人來說她兒子殺人,曾母便害怕地丟下織布的梭子,跳過圍牆逃走,信心崩潰了。

現以AB分別表事件通報殺人,及曾參殺人且設P(A|B)=P(Ac|Bc)=pP(B)=q。則由(6)式,得

(7) P(曾參殺人|通報殺人)=pq/[pq+(1-p)(1-q)]

曾參生長在春秋時代,是後世史學家所稱的亂世。為了自衛等原因,誰都無法絕不可能殺人。但他一向品德高尚,不會惹事生非,殺人的機率應很低。不妨就假設q=0.001這是事前機率。另一方面會來跟曾母通風報信的,應多半是鄉親熟人,沒什麼必要騙她,因此他們的通報,可信度應不低。但說不定看錯人,或由於輾轉誤傳,通報並非必然百分之百正確。假設p=0.9。即

P(通報殺人|曾參殺人)=P(通報未殺人|曾參未殺人)=0.9

p=0.9,及q=0.001代入(7)式,便得曾母於獲得曾參殺人的通報後,認為兒子會殺人的機率(事後機率)

q1=0.0009/(0.0009+0.0999)=1/112≈0.00893

雖從0.001提高了不少倍,只是仍不到百分之1。這麼小的機率,曾母自然不太在乎。待第二人來通報後,前述q1成為新的曾母以為曾參殺人的事前機率,至於p仍是0.9。將p=0.9,及q1=1/112代入(7)式中的pq,便得新的曾母認為兒子會殺人的機率(新的事後機率)

q2=3/40=0.075

機率仍不算太大,但再度提高了好幾倍。所以曾母雖然繼續織布,但兒不殺人的大話,就閉口不說了。待第三人來通報曾參殺人後,曾母認為兒子會殺人的機率(更新的事後機率)增至

q3=27/64=0.421875

此時發生的機率,可一點都不能說小了。曾母遂覺得大事不妙,於是三十六計,走為上策。我們再來看,假若曾母未逃,且還有第四人,前來通報曾參殺人,那會如何?可得

q4=243/280=0.868

這麼大的機率,曾母鐵定更要嚇壞了。

一旦講到條件機率,便不能不介紹著名的貝氏定理(Bayes' theorem),這是(5)式的推廣。此定理一般歸之於英國牧師貝氏(Thomas Bayes1702-1761)最先提出。但貝氏其實並未明確地給出此定理,只討論若干與它相關的問題,著名的天文學家及數學家,有法國牛頓之稱的拉普拉斯(Pierre-SimonMarquis de Laplace1749-1827),才是第一位完整給出此定理之敘述者。

假設事件B1B2,為樣本空間Ω之一分割(partition)。即B1B2,兩兩交集為(即彼此為互斥事件),且B1B2全部的聯集為Ω。則對任一事件A

(8) P(A)=Σi=1 P(A|Bi)P(Bi)

此為(4)式的推廣。且對任一Bj

(9) P(Bj|A)= P(A|Bj)P(Bj)/P(A)

其中分母P(A)可以(8)式代入分割也可只有有限多個,如BBc便構成Ω之一分割。Ωn個分割,其中n≥2,設為B1B2Bn,則得

(10) P(A)=Σni=1 P(A|Bi)P(Bi)

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (1RFB
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/5/10 上午 10:49:01

2003/10/20起第 9272891 位訪客
*