國立高雄大學統計研究所-心在南方

:::

:::

主題：統計下凡(七)

發表者：黃文璋　Email:huangwj@nuk.edu.tw

日期：2021/7/25 下午 05:53:26

7 隨機法則

人們常說大數據，開口閉口“利用大數據”，但有了大數據，一切問題便能迎刃而解嗎？恐怕未必。有大數據便有大數，我們先來看大數。由大數的多變，將會理解大數據的難以掌握。但有沒有能掌握時？

很多數加起來會如何？會很大嗎？不一定。對於無限等比級數，大家在中學時便知，如果公比r的絕對值|r|<1，則其和為有限。如級數1+2^-1+2^-2+2^-3+…+2^-n+…，不論加了多少項，我們知道其和都不會超過2，且級數和以2為極限。現看級數1+1/2+1/3+…+1/n+…，一般項是1/n。隨著n之增大，每次僅加一很小的量，由微積分知，當加到第n項時，n≥2，其和小於1+ log n，其中log是自然對數的符號，即以e為底。所以加到1億項時，其和小於1+ log10⁸<19.43；即使加到1兆項，其和小於1+ log10¹²<28.64，仍不太大。雖成長相當緩慢，但此卻為一發散級數，其和會無止盡地增大，以∞表其和。不過形式類似的級數1+1/2²+1/3²+…+1/n²+…，一般項是1/n²，此級數和之極限可求出，為π²/6，約僅1.6449，也就是除首項1之外，其餘無限多項的和，不超過0.65。至於級數1-1+1-1+…+(-1)ⁿ^-1+…，其和一直在1，0兩數間跳躍，永不會平穩下來。在微積分裡，花了不少篇幅，討論數列及級數的收斂與發散，檢驗一個數列或級數，一直持續進行下去會怎麼樣？即是否有能掌控的“終極點”(表極限存在)？或屬於無法掌控地跳躍不止、趨近至∞，或趨近至-∞？由前述幾個例子知，在數學裡，當遇到大數，“最終”究竟會如何，有時並非那麼容易能確定。

對於隨機現象，有些特別的隨機變數之和用途不小，且大數下之行為，能顯示某種能掌握的規律。這便是所謂隨機法則，大數法則及中央極限定理，是其中極重要的兩個，我們之前已提過，底下便來加以討論。

考完試，各班成績有高到接近滿分，亦有低到接近0分，如何評比各班的成績？比較各班平均成績之高低，為一常見的方式。湖水多深？深淺不一，遂以平均深度來表示。其他如平均壽命、平均國民所得等，人們可說經常在求平均，並以平均當做一組量之代表值。獨立地投擲一出現正面機率為p之銅板，以X_i表第i次投擲的結果，i≥1，且令X_i=1，或0，分別表第i次投擲得到正面或反面。X₁，X₂，…，X_n，便是一組樣本數為n之隨機樣本，每一皆有伯努力分佈Ber(p)。在此若X有Ber(p)分佈，則X之機率密度函數為

P(X=k) = p^k(1-p)^1-k，k=0,1。

又可求出E(X)=p。令樣本和

S_n = X₁+X₂+…+X_n，

表n次投擲後共得的正面數，則S_n有二項分佈B(n,p)。即

P(S_n=k) = C(n,k)p^k(1-p)^n-k，k=0,1,2,…,n，

其中

C(n,k) = n!/(k!(n-k)!)，k=0,1,2,…,n。

樣本平均S_n/n，便常被用來估計p。由於

E(S_n/n) = np/n = p，

所以，此估計量平均而言是準的。但平均是準的估計量很多，如X₁也是，因E(X₁)=p。也就是若第1次得到正面，則估計p=1，若得反面，則估計p=0。直觀上，只用到1個樣本的估計量，不可能會好，至於S_n/n則會是好很多之估計量。不僅這樣，當樣本數n愈來愈大，利用一簡單的不等式，可得對對∀ε>0(數學裡ε通常表一很小的數)，機率P(|S_n/n-p|>ε)，隨著n之不斷增大，將趨近至0。這是什麼意思？S_n/n取值在區間[0，1]，忽大忽小。且不論n再如何大，S_n/n都“可能”(機率為正)為0(n次投擲皆得反面)，或1(n次投擲皆得正面)。但當n很大時，S_n/n便不太容易(即機率很小)太偏離p，也就是S_n/n大致會在p附近一小範圍內波動。亦即S_n/n偏離p任一正數ε之機率，只要n夠大，便可任意小。以數學式子表示，即對∀ε>0，n→∞時，便有

P(|S_n/n-p|>ε)→0。

這便是大數法則較原始的版本。

大數法則並不侷限在只取值0，1的隨機變數。對一數列獨立且有共同分佈的隨機變數X₁，X₂，…，X_n，…，若期望值E(X₁)=μ存在，則對∀ε>0，n→∞時，便有P(|S_n/n-μ|>ε)→0。這便是較一般的大數法則，適用期望值存在的任何分佈。不過這其實是弱大數法則。即有另一強大數法則，且獨立的條件亦可放寬，但我們就此打住。

2020年美國總統選舉於11月3日舉行後，未通過連任的原任總統川普(Donald John Trump，1946-)，於12月2日，在社群媒體公布一段影片，其中呼籲翻轉大選結果。他堅稱“從統計上來說，我不可能輸”(It’s statistically impossible that I lost)。只是大家都知道，川普就是輸了。因而“不可能”究竟是什麼意思呢？

底下略說明，人們不時脫口而出之“不可能”的意思。NBA籃球比賽，兩隊只差2分，領先那方投籃沒進，落後那隊搶到籃板球，時間卻只剩下1秒，球不得不出手了。能來個超大號3分球逆轉比賽嗎？距離實在太遠了，球幾乎要飛過整個籃球埸，然後得進入一小籃框。觀眾莫不認為不可能，結果球居然進了，反敗為勝。對隨機現象，口語裡所謂“不可能”的事件，乃表發生機率極低。至於要多低才會被視為不可能，乃因情況而定，彈性相當大。有人問：今天會下雨嗎？答：不可能！談的機率大抵是0.01之類的，並不真那麼小；對統一發票，有人問：會中特別獎(要8碼全對，獎金1千萬元)嗎？答：不可能！此處談的機率為1億分之1，這機率算是很小了。數學裡，圓周率π<3.1416，這是確定的，絕無意外地成立。但對隨機現象，談的是機率。當n很大時，樣本平均S_n/n會不會沒離E(X₁)=μ很近？是有可能，不論n再大，S_n/n都可能偏離μ很遠，但機率很小，且當n很大時，S_n/n不離μ很近的機率，根本就微乎其微。微乎其微的機率何須太在意？早被歸入“不可能”的事件。因此n很大時，我們會視S_n/n差不多就是μ了。雖不中，亦不遠矣，而這不遠，也是指不遠的機率很大。當然，也會有人堅持認為，只要機率為正之事件，便永遠都可能發生。

其次來介紹中央極限定理。對一數列獨立且有共同分佈的隨機變數X₁，X₂，…，X_n，…，且假設E(X₁) =μ，及Var(X₁)=σ²皆存在。大數法則指出，當n很大時，S_n/n接近μ的機率很大。也就是

S_n/n-μ=(S_n-nμ)/n，

此量很可能會很小(即很接近0)。不過要注意，與n相比很小，絕不表S_n-nμ須很小。即使n再大，S_n仍可能偏離nμ很遠。是S_n/n才會大致在μ之附近！(此正如n很大時，n^1/2/n= 1/n^1/2的確會很小，但當n不斷增大時，n^1/2亦無止盡地增大)。有如使用顯微鏡，將草履蟲等微小物放大，以看清楚其變化，能將S_n/n-μ放大，或等價地說，S_n-nμ能不要除以n，而除以較小的量，使除之後，不至於過小也不至於過大嗎？將除數由n改為n^1/2即可。更明確地說，標準化後的S_n(即減去期望值再除以標準差)

(S_n/n-μ)/(σ/n^1/2) = n^1/2(S_n/n-μ)/σ，

當n愈來愈大時，其變化將愈清楚可見。而當n夠大時，其分佈可以標準常態分佈N(0,1)來近似。這便是中央極限定理。此處對X有N(0,1)分佈，其機率密度函數為

ϕ(x) = exp(-x²/2)/(2π)^1/2，x∈R。

物理上量測過程中的步驟很多，每一皆可能產生一微小的誤差。大數學家高斯(Johann Carl Friedrich Gauss，1777-1855)的誤差理論，推導出總誤差常有常態分佈。諸如身高、體重及智商等，醫學、生活及自然界裡的很多量，往往可以常態分佈當模式，常態分佈可說處處可見。這是此分佈以常態名之的主因，彷彿若其他分佈出現，便非常態。又，大數法則與中央極限定理最被人稱奇的，是其一般性。只要有一數列獨立且有共同分佈的隨機變數，什麼分佈並無關緊要，當共同的期望值存在，大數法則便適用；當共同的期望值及變異數皆存在，中央極限定理便適用。附帶一提，中央極限定理還有條件更寬鬆的版本，使其適用性更廣。不過實務上，通常上述版本就已夠了。

若想估計期望值μ，經重覆觀測n次後，得到樣本X₁，X₂，…，X_n，則可以樣本平均S_n/n來估計。只要n夠大，由大數法則知，此估計不會太離譜。但我們知道，不論n再大，S_n/n並不會就一直等於μ，至於偏離多遠？只要標準差σ存在，便可以中央極限定理來估計。如習慣用法，以Φ表N(0,1)分佈的分佈函數。則n很大時，

(1) P(|S_n/n-μ|≤d)=(P(|n^1/2(S_n/n-μ)/σ|≤n^1/2d/σ)≈2Φ(n^1/2d/σ)-1。

由上式得

(2) P(S_n/n-d ≤μ≤ S_n/n+d)≈2Φ(n^1/2d/σ)-1。

上式常可用來求μ之信賴區間(confidence interval)。底下來看一應用。

欲估計一銅板出現正面的機率p，持續投擲n次，得到一數列獨立且有共同分佈的隨機變數X₁，X₂，…，X_n，其中X_i=1，或0，分別表第i次得到正面或反面，i=1，…，n。則

E(X_i) = p，

Var(X_i) =(p(1-p))^1/2。

故n很大時，由(2)式，得

(3) P(S_n/n-d≤p≤ S_n/n+d) = P(p∈ [S_n/n-d, S_n/n+d])

≈2Φ(n^1/2d/(p(1-p))^1/2)-1 ≥ 2Φ(2n^1/2d)-1，

此處用到，對0<p<1，必有

(p(1-p))^1/2 ≤ 1/2。

若欲

2Φ(2n^1/2d)-1 ≥ 1-α，

其中0<α<1，則

Φ(2n^1/2d) ≥ 1-α/2。

現取α=0.05，由N(0,1)分佈之機率值表，得Φ(1.96)≈0.975，故約略有2n^1/2d ≥1.96。由此得

(4) n ≥ 0.98²/d²，

取d=0.03，由(4)式得n≥1,067.1…。由於n須為整數，得n≥1,068。若投擲數n=1,068，且得S_n=551，則對p之估計值S_n/n=551/1,068≈0.5159。再代入(3)式，得

P(0.5159-0.03≤p≤0.5159+0.03)=P(0.4859≤p≤0.5459)≥1-0.05=0.95。

區間[0.4859, 0.5459]便稱為p之一(近似的)95%信賴區間。以一值0.5159估計p(此稱為點估計)，有時會忐忑不安，覺得p根本“不可能”剛好等於0.5159。但以一區間[0.4859, 0.5459] 來估計p，看起來雖不像點估計那麼鐵口直斷，但這樣的估計卻更值得“信賴”，這是信賴區間一詞的由來。至於有多信賴呢？信心水準(或稱信賴水準、信賴度等)為95%。

另一方面，由(4)式得d≥0.98/n^1/2。有時便採d≈0.98/n^1/2。或就簡單些，反正就是近似，一旦知道n，便令

(5) d=0.98/n^1/2，

以求出估計誤差d。因n=1,068時，d≈0.03，故實際操作時，如果n>1,068，則d<0.03；如果n<1,068，則d >0.03。

在上述推導中，有幾處用到不等式。如將(p (1-p))^1/2以1/2取代，這樣會造成誤差嗎？會。但無須擔心，因這樣將使(3)式最左側大於最右側，也就是我們得到的信賴區間，信心水準可能不只95%，說不定還超過。而將n由1,067.1…換成1,068，又會使信心水準再稍大些。但這些其實都不必太計較，因即使n再怎麼大，n^1/2(S_n/n-μ)/(p(1-p))^1/2也不會有N(0,1)分佈，只是近似而已。更何況實務上，樣本數n通常也沒真那麼大，不過1千上下，因而常態近似是否有那麼準確，誰也不敢保證。於是宜保留些，將信心水準說成95%就好了。另外，我們說有95%的信心水準，p會落在區間[0.4859, 0.5459]，其中95%是指什麼？機率嗎？有人以為，在取樣前，[S_n/n-d, S_n/n+d]為一隨機區間，那時講p落在此區間之機率為0.95可以。但取樣後，得到S_n之值，前述區間成為一固定區間，此時若說p落在此固定區間之機率為0.95，就沒道理了。因每次投擲會得到不盡相同的S_n，因而得到不盡相同的信賴區間，而怎可能那些不同的固定區間，每一會包含p之機率，皆為0.95？聽起來似乎有理。但別忘了主觀機率，依上述程序得到的區間，若某君覺得就是有0.95之機率會涵蓋p，也沒什麼不行。甚至該君還可反問，此區間有比0.95更適合的涵蓋p之機率值嗎？

附帶一帶，不但對一固定的信賴區間，可談參數落在此區間之機率，只要未知，便可談事件發生的機率。正如懷孕6個月了，胎兒性別根本已定，但不知者仍可猜會生男或生女；考試當天，明明試卷已印製完成，在做最後衝刺的學生，仍可賭某題是否會考。

暫無回應

回本區首頁

回應總數0

姓名：	回應前，請先註冊或登入。
E-mail：
內容：
驗證碼：	（8I02）

:::

地　　址：811高雄市楠梓區高雄大學路700號
電　　話：07-5919362 傳真：07-5919360 e-mail: stat@nuk.edu.tw
更新日期：2024/4/11 上午 09:16:10

2003/10/20起第

9016733

位訪客