8 隨機法則(二)
欲估計某地區選民,對某候選人之支持度p,遂執行一民意調查。自該地區隨機抽取n個合格選民做問卷,得到樣本X1,X2,…,Xn,其中Xi=1,或0,分別表第i個選民支持,或不支持該候選人,i=1,…,n。要注意與投擲銅板的情況不同,由於民調時樣本的抽取,屬於取出後不放回(總不能問同一人兩次),因此各樣本間並不獨立,於是中央極限定理本來不適用。但因執行民調時,通常樣本數(1千個左右)與選民數(通常總有幾萬人以上,否則便沒太大必要抽樣了)相比,往往不太大,因而將樣本取出後不放回,視同取出後放回(如此樣本便獨立了),比起民調時由於拒答、未誠實回答,或問卷設計不當等,所產生的誤差,樣本間不獨立的誤差,其實尚可忍受。民調時通常設定信賴區間之信心水準為95%,且預設估計誤差為3%,由此得到預定的成功樣本為1,068。經抽樣後,成功樣本數n很少會剛好等於1,068。將實際的n,代入誤差公式
d=0.98/n1/2,
便得此次抽樣的估計誤差d。例如,若n=1,100,則d≈0.0295;若n=952,則d≈0.0318。
估計誤差d何以預設為3%,誤差1%不是更精準嗎?由誤差公式即知,d若取為1%,將使樣本數n從1,068增為9,604,差不多是9倍了。民調往往有即時性,9倍的樣本,將耗費更大的人力、物力及財力,也會讓調查時程更冗長,導致所得資訊失去時效。民調結果只是個參考,我們說過了,其中本已有相當多不易避免之各式各樣的誤差,與其試圖大幅降低d,因而增加調查困難,不如努力改進調查品質(包含問卷設計及訪員訓練等)。另外,因Φ(2.576)≈0.995,若信心水準想由95%增為99%,則誤差公式中的0.98得改為1.288,若d要維持在0.03,則n便須增至1,844。樣本數增加不說,99%的信心水準,看起來信心滿滿,卻因調查過程必會包含的各種大小誤差,因而宣稱高達99%的信心水準,反會令人感到心虛。故也不認為有此必要。
一般而言,只要估計就會有誤差,95%的信心水準,表平均每得到20個信賴區間,其中就有1個不包含欲估計的參數。在實務上,若真能這樣便很好了。較令人擔心的反而是,調查品質不佳,使實際的信心水準,比95%低很多。
附帶一提,設在某縣市抽樣,以估計對某候選人之支持度p,得到成功的樣本數有1千餘,由此產生一信賴區間。由於各鄉(區)之成功樣本數,分別有數十個至上百個不等,因而又分別得到在各鄉(區)之p的信賴區間,並由誤差公式得到各鄉(區)之估計誤差。例如,若在某鄉(區)之成功樣本數有64個,則d=12.25%。但這其實是有問題的,即使撇開其他因素不談,12.25%的估計誤差也未免太大了。
初期的大數法則及中央極限定理,均針對伯努力分佈,此因這應是一最簡單又幾乎是最常見的分佈。生活裡的隨機現象,常出現恰有兩個結果的。如贏或輸、生男或生女,及格或不及格等。一試驗若恰有兩個可能的結果,不妨分別以成功及失敗稱之,若成功機率為p,便稱此為一參數p之伯努力試驗(Bernoulli trial)。若以X=1或0,分別表一伯努力試驗之結果為成功或失敗,則X有Ber(p)分佈。對一數列n個獨立的參數p之伯努力試驗,我們常對其總成功數Sn有興趣,而Sn便有B(n,p)分佈。Sn的機率值中有階乘數,如n!=n(n-1)(n-2)…1,相較於次方,如an,a≠0,不論n多大,只要有個小計算器,經由取對數,很快便能知其約略的值。但對n!,當n稍大時,便不容易求出。如若問100!為何?便無法回答(但可藉助Stiring公式知其所在範圍)。二項分佈B(n,p)常出現,卻在n較大時,其機率值便不好計算,此不便是當初發展中央極限定理的主要動機。又,N(0,1)分佈之機率密度函數為
ϕ(x) = exp(-x2/2)/(2π)1/2,x∈R。
在x-y座標平面上,其圖形為鐘形,最高點在x=0,左右對稱於y軸,向兩側下降,以x軸為極限。
由中央極限定理,若Sn有二項分佈B(n,p),則當n夠大時,標準化後的Sn,即(Sn-np)/(np(1-p))1/2,有近似的N(0,1)分佈。只是所謂n夠大又是多大呢?不少教科書說,通常若np及n(1-p)皆大於或等於5,則以常態分佈來近似二項分佈B(n,p),便將夠精確了。但若p未知時,如何知np及n(1-p)是否大於5?若有些資訊,如知p介於0.4與0.5之間,則n只要小小的13即可。但若無任何p之資訊呢?有另一指引。對一般期望值及變異數皆存在之一數列獨立且有共同分佈的隨機變數之和Sn,很多教科書指出,“通常”n若達到30,則中央極限定理便適用了。30個樣本不是很容易嗎?且還什麼分佈都可以呢!但實務上,是存在“不通常”的情況。如若隨機樣本之共同分佈,為參數0.001的波松分佈(Poisson distribution)P(0.001),則樣本和Sn有P(0.001n)分佈。即使n高達500,S500有P(0.5)分佈,並不必去近似。若硬要以常態分佈去近似會如何?就是誤差很大而已!對本例,恐怕要到n至少7,000,才適合以常態近似。所以,實際應用時,仍得謹慎些。波松分佈取值在非負整數0,1,2,…。在此對P(λ)分佈,λ>0,其機率密度函數為,此分佈之機率值很容易求出,
f(k) = e-λλk/k!,k=0,1,2,…。
關於隨機法則,我們有另一相當有用的法則,也是針對伯努力試驗。當Sn有B(n,pn)分佈,且n→∞時,npn→λ,其中λ>0為一常數,則n→∞時,B(n,pn)的分佈函數會收斂至P(λ)的分佈函數。這便是稀有事件法則(law of rare events)。由此法則,在實務上,對某一發生機率p很小的稀有事件,若重覆觀測數n夠大,且np“適當地”大時,則該事件共發生的次數Sn(有B(n,p)分佈),便可以P(np)分佈來近似。這種情況很多。若某地每天會發生因車禍致命的事件之機率為0.004,則因365×0.004=1.46,一年365天,會有致命車禍的日數,便可以P(1.46)分佈來當近似的模式。至於所謂np要適當地大,到底多大才屬“適當”?有些書說n,p宜滿足np≤7。那如果np>7會如何?由於p很小,因而1-p很接近1,故此時亦必有n(1-p)>7,如此中央定理便適用了。
稀有事件法則用途廣泛,諸如某保險公司每月意外死亡的理賠數、某醫院每天子時(晚上11點至1點間)進急診室的患者人數,及全世界每年墜機次數等,皆可以波松分佈當模式。每架飛機一次航行會墜落乃屬稀有事件,但全世界每年飛機航行次數相當多,因而全年的墜機次數,便有可能適合以波松分佈來當模式。波松分佈有個參數,此參數該如何得知?由於波松分佈之參數即期望值,故只要收集夠多的樣本,算出樣本平均,便可以之來估計參數。
我們說過,中外歷史上,曾實際去投擲銅板多次的人,應不會有太多。不過我國約在1千年前,便曾有1次投擲100個銅板者。在宋朝蔡絛著的“鐵圍山叢談”(宋朝史料筆記中,相當重要的一本)一書第二卷中,記載驍勇善戰的狄青(1008-1057)之一則事蹟。在率軍征討反宋的儂智高(1025-1055,一位領地在今越南的部族首領)前,大軍才一離開桂林,為鼓舞士氣,狄青“取百錢自持,與神約,果大捷,則投此錢盡錢面也期。”在萬人注視下,他揮手一擲,“百錢旨面”(旨面可能指有字那面)。狄青叫人將錢封住,說“俟凱旋,當酬神取錢”。待打勝仗回來,在眾人同觀下,他打開封條,“乃兩面錢也”。在民間信仰裡,狄青乃武曲星下凡(見“水滸傳”之“楔子”),是宋朝傳奇名將,因而此事蹟亦出現在一些通俗的兒童讀物中,讓狄青擲百錢一事,廣為流傳。事實上,投擲100個公正的銅扳,全出現正面,其機率為0.5100,約為7.88861×10-31。這麼小的機率,應沒人反對屬“不可能”會發生的事件。蔡絛是誰呢?有人說不定好奇。他生卒年不明,惟其父蔡京(1047-1126)倒是頗為人熟知,但並不是因他曾先後4任北宋宰相,而是因他乃“水滸傳”裡四大奸臣之一,且留下一著名的故事。第十五回的回目是“楊志押送金銀擔,吳用智取生辰綱”,其中生辰綱在唐宋時,指成批運送的生日禮物。在此回中,蔡京女婿北京大名府知府梁世傑,為賀他生日所送的“十萬貫金珠寶貝”,被書生吳用等人以智奪取。身為軍師,卻被取名吳用,“水滸傳”之作者,可能有“百無一用是書生”之意。
歷史上擲百錢者尚有一位,也是武將。在二月河(本名凌解放,1945-2018)的“康熙大帝”第三卷“玉宇呈祥”(下)裡,講了下述故事。清朝施琅(1621-1696)於攻打台灣前,拿出一把銅錢,向部屬說,“100枚康熙銅錢,擲向台灣海域圖,倘若我軍出師順利,當有95枚以上的字面朝上。”一語既出,將台上下將士們無不失色。結果一擲之下,有99枚“康熙”字面朝上。當然立即軍心大振。原來施琅離京前,康熙皇帝特賜他100枚兩面皆字的銅錢,並告訴他如何操作。施琅怕有精明者起疑,特地換了5枚為正常銅板,如此反而讓屬下更相信此事為真。不過這故事,似未見於其他典籍,較可能是二月河仿之前狄青的擲幣所編出的,但做了些修改。因書是給今人看的,而現代人多少學過一些機率,了解若1百個公正銅板皆出現正面,將無人會信其中沒有作假。只是出現95個正面就容易嗎?對投擲100個公正的銅扳,至少出現95個正面,利用二項分佈的機率密度函數,可輕易求出機率為79,375,496×0.5100,約為6.26162×10-23。此機率是比出現100個正面大很多,有7千9百多萬倍。但仍是相當小,相較於1張統一發票,中特別獎之機率為10-8,此仍屬“不可能”會發生的事件。
大數法則及中央極限定理,有時會被混為一談。另外,偶會被過度推崇,以為能無所不在。如台灣在2014年11月底,所舉行的縣市長選舉投票前,有位台北市長候選人,拋出以遴選委員會,來挑選首長的主張。組遴選委員會的概念本來還好,但說到這裡就該結束了。只是世上懂得何時結束的人少,愛畫蛇添足的人多。這位市長候選人,又給了下述解釋,反而自曝其短:
在統計學上,N>25,就會接近大數法則,也就是中央極限理論,不太容易出現偏頗的情況。雖然他準備設置的遴選委員會成員不到25人。但以過去經驗來看,只要15個人就會蠻準確的。
其中N是什麼並沒說明,應是指遴選委員的人數,且N>25時,究竟何者會“接近”大數法則也沒說,較可能是指大數法則能“適用”。又大數法則與中央極限定理的內涵,乃完全不同,所以並無“大數法則也就是中央極限定理”的講法。且此二隨機法則,均針對隨機樣本(即獨立且有共同分佈,惟此條件可以寬鬆些)。如今遴選委員會的成員,不外市長或各界推薦,與隨機樣本相差十萬八千里。不要說首長的遴選,與大數法則或中央極限定理均沾不上邊,就算遴選委員是隨機產生,且令Xi=1,或0,分別表第i個遴選委員對某特定首長候選人支持或不支持,i=1,2,…,N,則大數法則是說,N夠大時(只是遴選委員的人數N當然不會有多大),樣本平均SN/N做為台北市民對某特定首長候選人支持率p之估計,不致於太離譜。至於支持率最高,是否便是最適合的首長人選?大數法則可沒說,且這也非大數法則之功能。至於中央極限定理乃用來求p之信賴區間,在這裡根本用不上。因而雖言之鑿鑿,且宣稱“蠻準確的”,我們卻必須說,若選出的首長人選不適合,絕不能怪大數法則或中央極限定理,否則便是甩鍋了。