國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:統計入世(六)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2016/10/2 下午 01:52:25

6 易被遺忘的獨立性

某日你逛夜市,在一遊戲攤位前停住了。每次參加要50元,投擲一骰子兩次,若點數和至少有10,便能獲得一隻娃娃。你被可愛的娃娃所吸引,遂想試試手氣。在沒有其他資訊下,骰子不妨就視為公正。則可輕易求出,每次參加能獲得娃娃的機率為1/6,機會不算太大。你第一次擲出6點,喔,局面樂觀起來。因得到娃娃的機率,由1/6提高到1/2。與數學中的不變大異其趣,在隨機世界裡,一旦有新的資訊產生,事件發生的機率,將可能改變,這便是條件機率。機率值會變,是機率的一特性。

一聽到條件機率,你大約覺得沒什麼,中學早學過了。不就是公式

(1) P(A|B)=P(AB)/P(B)

其中AB為二事件,且事件B的機率P(B)不為0。在上式中,限制P(B)不可為0是必須的,因P(B)分母。此處符號我們稍微說明一下。AB表事件AB之交集,即AB皆發生的事件,而P(A|B)表給定事件B發生之下,事件A發生之條件機率。我們知道交集是可交換的,即AB=BA。又為了簡便,諸如事件發生,及之下等,這些字眼有時會省略掉。

不要以為只不過是二機率P(AB)P(B)相除,看似沒什麼的條件機率,在應用時,卻屢會讓人感到困惑。在進一步說明前,我們先介紹獨立性(independence)

什麼時候P(A|B)不受B之影響?也就是何時給定BA之條件機率不變,即仍等於P(A)?做決策仰賴資訊,如今得知B發生,A發生之機率,卻沒有改變。也就是B這個資訊,對求A的機率時沒用。這種情況引人注意,該將它弄清楚。首先,由(1)式,可看出當

(2) P(AB)= P(A)P(B)

便能有P(A|B)=P(A)。反過來,當P(A|B)=P(A),也導致(2)式成立。唯一略有不同的是,在P(A|B)裡,P(B)不能為0,而在(2)式裡,未對P(B)做任何限制。對二事件AB,當(2)式成立,我們便說AB獨立(independent);反之,若AB獨立,便表(2)式成立。所以,若AB獨立,且P(B)不為0,便有P(A|B)=P(A)。由於AB=BA,所以AB獨立,及BA獨立,是同一回事。有時遂會說AB相互獨立(mutually independent),但為了簡便,常省略相互二字。曾有人說,機率論不過就是測度論(measure theory)加上獨立性的概念。此講法雖有些誇大,但由此可見獨立性在機率論裡之重要。

(2)式成立,且P(A)不為0,因

P(B|A)=P(BA)/P(A)=P(A)P(B)/P(A)=P(B)

即亦有P(B|A)=P(B)。換句話說,當AB獨立,且P(A)不為0時,P(B|A)也不受A之影響。易言之,二事件若獨立,則給定其中一事件(只要其機率不為0),則另一事件之條件機率值不受影響。在本節之始投擲骰子之例裡,第一次擲出的點數(事件A),與兩次擲出的點數和(事件B),可看出便不獨立。又讀者可能也看出了,在此例中,兩次投擲的結果,我們乃隱含地假設為獨立,這是常會做的假設。

以上是兩個事件的獨立,也可有n個事件的獨立,其定義此處略過。若n個事件獨立,則其交集的機率,亦等於n個事件各自機率的乘積。

獨立源自於條件機率,那為何在以(2)式定義AB獨立時,我們並不在意P(A)=0P(B)=0?這完全不難理解,因發生機率為0的事件,豈有什麼好掛念的?C君問D君,如果他成為台灣首富,願不願意將財產捐出一半?D君毫不猶豫便答應了,還加碼只需留1%花用,其餘99%全捐出,豪氣干雲。於感謝他的慷慨之餘,C君再問D君,願不願意現在便捐1萬元,D君卻遲不回應。怎麼回事?因成為台灣首富,D君認為發生的機率為0,於是什麼都可答應,反正不擔心須兌現。至於1萬元,雖非巨額,卻是實實在在,口袋裡目前便有的,因此得看緊一點。

當事件AB獨立,則AB皆發生的機率P(AB),便等於AB各自發生的機率相乘,也就是(2)式會成立,這時AB的機率,便可很快求出。但兩個事件並不見得會獨立,因此(2)式千萬不能隨意引用,除非已確定二事件獨立。只是有些事件的獨立較易看出,有些則不然。底下給幾個例子。

投擲一公正的骰子,令A表出現偶數(即出現的點數可能為246)B表出現的點數至少為4(即出現的點數可能為456)。則AB表出現的點數為46。立即便有

P(A)=P(B)=1/2,且P(AB)=1/3

由於

P(A)P(B)=1/4

不等於P(AB),故AB不獨立。事實上,若已知B發生,則便知出現的點數較可能為偶數(2/3的機率)。即P(A|B)受到B之影響。此算是稍微想一下,便能看出AB獨立之例。

假設生男與生女的機率皆為1/2,且設婦女所生各胎孩子的性別為獨立。今有某婦女,令A表她所生的孩子中,有男有女;B表她所生的孩子中,最多有一女孩。先考慮該婦女有2個孩子。則AB=A,表她生了一男一女。由於

P(A)=1/2P(B)=3/4,且P(AB)=1/2

P(AB)P(A)P(B)不相等,因而AB不獨立。其次考慮該婦女有3個孩子。則可求出

P(A)=3/4P(B)=1/2,且P(AB)=3/8

P(AB)=P(A)P(B),因而AB獨立。但直觀上並不易看出,何以在第一個情況裡,AB不獨立,而在第二個情況裡,AB卻獨立。對該婦女有4個孩子的情況,讀者不妨自行討論,看此時AB是否獨立。

底下藉著名的人民訴柯林斯”(People v. Collins)案,來說明若忽視獨立性,其影響可能不小。可參考Gray(1983)一文。

美國曾發生如下一案件。1964618日接近中午時,在洛杉磯(Los Angeles)郊區一條巷子裡,大白天發生一起搶劫案。依受害的老婦人,及一目擊男士,向警方的描述,嫌犯是一對黑白的男女,且具有下述特徵:

黑人男子留鬍子及八字鬍;年輕女孩是高加索人(Caucasian,亦稱白種人),身高5呎多,金髮且綁個馬尾。兩人開著一輛黃色汽車逃逸。

幾天後,洛杉磯警方以搶劫的罪名,逮捕了柯林斯夫婦(Malcolm Ricardo CollinsJanet Louise Collins)。柯林斯先生是黑人,雖被逮捕時臉上刮得清潔溜溜,但有證據他直到不久前,還留鬍子及八字鬍。金髮的柯林斯太太,則經常綁個馬尾。他們有一輛車身有部分是黃色的林肯汽車(Lincoln),那是福特汽車公司(Ford Motor Company)的主要品牌之一。只是受害者及目擊者,均無法指證柯林斯先生或他太太,確實就是他們所見到的搶劫者。檢察官科學辦案,利用機率!他還找來附近一所州立大學的一位數學教授,以專家的身分,上法庭為其機率運算作證。

檢察官列出兩位嫌犯的6項特徵,並各給出洛杉磯的居民裡,會有這些特徵的機率:

黑人男子留鬍子,機率為1/10

男子留八字鬍,機率為1/4

白人女子有金髮,機率為1/3

女子綁馬尾,機率為1/10

同一車內坐一對不同種族的男女,機率為1/1,000

車身為黃色,機率為1/10

顯然女子身高5呎多,並未被檢察官列入須考慮的特徵。在法庭上,檢察官問那位數學教授:

若有一些獨立事件,則它們皆發生的機率,為各自發生的機率相乘,這樣是否不對?(Is it not true that if we have independent events we find the probability that they all occur by multiplying the individual probabilities?)

雖可能是這輩子第一次上法庭,在證人席上,該教授也不會忘記求交集的機率時,應留意的關鍵。他試圖指出,上述那些事件遠非獨立”(far from independent)。大家應會理解,至少留鬍子與留八字鬍,便很可能不獨立。而金髮與綁馬尾,兩事件是否獨立,也得確認一下。但霸氣的檢察官打斷他:

你僅回答問題就好。(Just answer the question.)

這法庭上的攻防場景,正如平常我們在電影裡所見。可憐的教授,他無法強調問題不能如此切割。但有如誤入叢林的小白兔,他只好說:

同意就是相乘。(“Yes” he had to admit, “one does multiply”)

檢察官接著問:

這些機率的乘積,難道不是1/12,000,00嗎?(And the product of these probabilities is 1/12,000,000, is it not?)

對這第二個問句,教授只能再度表示同意。已被這些深奧機率搞糊塗的眾人,至此鬆了一口氣,無人再對教授提問。任務結束,教授退席,他也鬆了一口氣。本以為這趟法庭之旅,是走出學術象牙塔的第一步,經答了兩個Yes後,可能再也不走入凡間了。他可能納悶,雖檢察官明明是說有一些獨立事件,何以眾人卻忽視那麼明顯的字,直接接受結論。

稍後檢察官乘勝追擊,說他對那些機率的估計,都算相當保守。由於整個洛杉磯都會區的人口約有1,200萬,而符合6項特徵的機率亦為1/1,200萬,因此要在此區域找到柯林斯夫婦外,另一對符合6項特徵的男女,機率大約是10億分之1,也就是幾乎不可能存在。因此他宣稱以數學證明了他們有罪(he had mathematical proof of their guilt)。雖缺乏直接證據,但機率提供的佐證,讓陪審團覺得如此強而有力,因此沒有猶豫,迅即判柯林斯夫婦有罪。

眾多懾服於機率權威的人裡面,當然不會包括柯林斯夫婦。他們可沒被檢察官的機率幻術所迷惑,糊裡糊塗就相信自己真的幹了那起搶劫案。他們提出上訴。1968年,加州最高法院(Supreme Court)61的票數(仍有1位法官留在機率幻術中)翻案,宣判柯林斯夫婦無罪。最高法院的判決書裡,對不要誤用數學(機率),做了一番提醒,且特別指出:

在我們的電腦化社會裡,數學乃一真實的魔法師,於協助審判者尋找真相時,萬不可施魔法迷惑他。(Mathematics, a veritable sorcerer in our computerized society, while assisting the trier of fact in the search for truth, must not cast a spell over him.)

其中“trier of fact”,乃指審理案件者,可能為陪審團或法官。

附帶一提,就算上述那6項特徵獨立,且檢察官估計的機率都可信,即假設從洛杉磯隨機挑一對男女,符合6項特徵的機率為1/1,200萬,也不表除柯林斯夫婦外,再無其他對男女會符合。洛杉磯有多少對男女,並不得而知。該扣掉小孩,但男女對數,仍應超過人口數1,200萬。就以1,200萬對計好了。由於每對男女符合6項特徵的機率1/1,200萬很小,而男女對數1,200萬很多,利用以波松分佈(Poisson distribution)做為二項分佈之近似(Poisson approximation to the binomial distribution,常簡稱波松近似),可得洛杉磯的男女中,會符合6項特徵的對數,可以參數1之波松分佈來近似。如此可求出在給定已有一對男女(柯林斯夫婦)符合下,會有另一對符合之機率約為0.4177,此值遠遠大於檢察官所提供,那微乎其微的10億分之1。事實上,若以A表符合的男女對數至少為1B表符合的男女對數至少為2,則便是要求條件機率P(B|A)=P(B)/P(A ),此因這裡有BA=B。至於P(A)P(B),便用參數1之波松分佈的機率值來近似,其計算可見黃文璋(2003)116

做決策常會藉助機率,雖往往只不過是些簡單的運算,但其中獨立性卻常被遺忘。曾有人提出核能電廠發生事故造成若干人死亡的機率。如何得到?原來他們認為要步驟一、二、,皆失誤才會發生事故。依序給出每一步驟發生失誤之機率,然後全部相乘。由此得到一小到不能再小,10的負很多次方的機率值,於是宣稱核能電廠相當安全。就算所提供之每一步驟發生失誤的機率為正確,但各步驟發生失誤之事件獨立嗎?在未確定獨立前,怎可胡亂將那些機率相乘?

參考文獻

1. 黃文璋(2003)。數理統計。華泰文化事業股份有限公司。

2. Gray, M. W. (1983). Statistics and the law. Mathematics Magazine, 56, 67-81.

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (LPRS
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/5/16 上午 09:00:18

2003/10/20起第 9662698 位訪客
*