國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:統計下凡(七)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2021/7/25 下午 05:53:26

7 隨機法則

人們常說大數據,開口閉口利用大數據,但有了大數據,一切問題便能迎刃而解嗎?恐怕未必。有大數據便有大數,我們先來看大數。由大數的多變,將會理解大數據的難以掌握。但有沒有能掌握時?

很多數加起來會如何?會很大嗎?不一定。對於無限等比級數,大家在中學時便知,如果公比r的絕對值|r|<1,則其和為有限。如級數1+2-1+2-2+2-3+…+2-n+…,不論加了多少項,我們知道其和都不會超過2,且級數和以2為極限。現看級數1+1/2+1/3+…+1/n+…,一般項是1/n。隨著n之增大,每次僅加一很小的量,由微積分知,當加到第n項時,n≥2,其和小於1+ log n,其中log是自然對數的符號,即以e為底。所以加到1億項時,其和小於1+ log108<19.43;即使加到1兆項,其和小於1+ log1012<28.64,仍不太大。雖成長相當緩慢,但此卻為一發散級數,其和會無止盡地增大,以表其和。不過形式類似的級數1+1/22+1/32+…+1/n2+…,一般項是1/n2,此級數和之極限可求出,為π2/6,約僅1.6449,也就是除首項1之外,其餘無限多項的和,不超過0.65。至於級數1-1+1-1+…+(-1)n-1+…,其和一直在10兩數間跳躍,永不會平穩下來。在微積分裡,花了不少篇幅,討論數列及級數的收斂與發散,檢驗一個數列或級數,一直持續進行下去會怎麼樣?即是否有能掌控的終極點”(表極限存在)?或屬於無法掌控地跳躍不止、趨近至,或趨近至-∞?由前述幾個例子知,在數學裡,當遇到大數,最終究竟會如何,有時並非那麼容易能確定。

對於隨機現象,有些特別的隨機變數之和用途不小,且大數下之行為,能顯示某種能掌握的規律。這便是所謂隨機法則,大數法則及中央極限定理,是其中極重要的兩個,我們之前已提過,底下便來加以討論。

考完試,各班成績有高到接近滿分,亦有低到接近0分,如何評比各班的成績?比較各班平均成績之高低,為一常見的方式。湖水多深?深淺不一,遂以平均深度來表示。其他如平均壽命、平均國民所得等,人們可說經常在求平均,並以平均當做一組量之代表值。獨立地投擲一出現正面機率為p之銅板,以Xi表第i次投擲的結果,i≥1,且令Xi=1,或0,分別表第i次投擲得到正面或反面。X1X2Xn,便是一組樣本數為n之隨機樣本,每一皆有伯努力分佈Ber(p)。在此若XBer(p)分佈,則X之機率密度函數為

P(X=k) = pk(1-p)1-kk=0,1

又可求出E(X)=p。令樣本和

Sn = X1+X2+…+Xn

n次投擲後共得的正面數,則Sn有二項分佈B(n,p)。即

P(Sn=k) = C(n,k)pk(1-p)n-kk=0,1,2,…,n

其中

C(n,k) = n!/(k!(n-k)!)k=0,1,2,…,n

樣本平均Sn/n,便常被用來估計p。由於

E(Sn/n) = np/n = p

所以,此估計量平均而言是準的。但平均是準的估計量很多,如X1也是,因E(X1)=p。也就是若第1次得到正面,則估計p=1,若得反面,則估計p=0。直觀上,只用到1個樣本的估計量,不可能會好,至於Sn/n則會是好很多之估計量。不僅這樣,當樣本數n愈來愈大,利用一簡單的不等式,可得對對ε>0(數學裡ε通常表一很小的數),機率P(|Sn/n-p|>ε),隨著n之不斷增大,將趨近至0。這是什麼意思?Sn/n取值在區間[01],忽大忽小。且不論n再如何大,Sn/n可能”(機率為正)0(n次投擲皆得反面),或1(n次投擲皆得正面)。但當n很大時,Sn/n便不太容易(即機率很小)太偏離p,也就是Sn/n大致會在p附近一小範圍內波動。亦即Sn/n偏離p任一正數ε之機率,只要n夠大,便可任意小。以數學式子表示,即對ε>0n→∞時,便有

P(|Sn/n-p|>ε)→0

這便是大數法則較原始的版本。

大數法則並不侷限在只取值01的隨機變數。對一數列獨立且有共同分佈的隨機變數X1X2Xn,若期望值E(X1)=μ存在,則對ε>0n→∞時,便有P(|Sn/n-μ|>ε)→0。這便是較一般的大數法則,適用期望值存在的任何分佈。不過這其實是弱大數法則。即有另一強大數法則,且獨立的條件亦可放寬,但我們就此打住。

2020年美國總統選舉於113日舉行後,未通過連任的原任總統川普(Donald John Trump1946-),於122日,在社群媒體公布一段影片,其中呼籲翻轉大選結果。他堅稱從統計上來說,我不可能輸”(It’s statistically impossible that I lost)。只是大家都知道,川普就是輸了。因而不可能究竟是什麼意思呢?

底下略說明,人們不時脫口而出之不可能的意思。NBA籃球比賽,兩隊只差2分,領先那方投籃沒進,落後那隊搶到籃板球,時間卻只剩下1秒,球不得不出手了。能來個超大號3分球逆轉比賽嗎?距離實在太遠了,球幾乎要飛過整個籃球埸,然後得進入一小籃框。觀眾莫不認為不可能,結果球居然進了,反敗為勝。對隨機現象,口語裡所謂不可能的事件,乃表發生機率極低。至於要多低才會被視為不可能,乃因情況而定,彈性相當大。有人問:今天會下雨嗎?答:不可能!談的機率大抵是0.01之類的,並不真那麼小;對統一發票,有人問:會中特別獎(8碼全對,獎金1千萬元)嗎?答:不可能!此處談的機率為1億分之1,這機率算是很小了。數學裡,圓周率π<3.1416,這是確定的,絕無意外地成立。但對隨機現象,談的是機率。當n很大時,樣本平均Sn/n會不會沒離E(X1)=μ很近?是有可能,不論n再大,Sn/n都可能偏離μ很遠,但機率很小,且當n很大時,Sn/n不離μ很近的機率,根本就微乎其微。微乎其微的機率何須太在意?早被歸入不可能的事件。因此n很大時,我們會視Sn/n差不多就是μ了。雖不中,亦不遠矣,而這不遠,也是指不遠的機率很大。當然,也會有人堅持認為,只要機率為正之事件,便永遠都可能發生。

其次來介紹中央極限定理。對一數列獨立且有共同分佈的隨機變數X1X2Xn,且假設E(X1) =μ,及Var(X1)=σ2皆存在。大數法則指出,當n很大時,Sn/n接近μ的機率很大。也就是

Sn/n-μ=(Sn-)/n

此量很可能會很小(即很接近0)。不過要注意,與n相比很小,絕不表Sn-須很小。即使n再大,Sn仍可能偏離很遠。是Sn/n才會大致在μ之附近!(此正如n很大時,n1/2/n= 1/n1/2的確會很小,但當n不斷增大時,n1/2亦無止盡地增大)。有如使用顯微鏡,將草履蟲等微小物放大,以看清楚其變化,能將Sn/n-μ放大,或等價地說,Sn-能不要除以n,而除以較小的量,使除之後,不至於過小也不至於過大嗎?將除數由n改為n1/2即可。更明確地說,標準化後的Sn(即減去期望值再除以標準差)

(Sn/n-μ)/(σ/n1/2) = n1/2(Sn/n-μ)/σ

n愈來愈大時,其變化將愈清楚可見。而當n夠大時,其分佈可以標準常態分佈N(0,1)來近似。這便是中央極限定理。此處對XN(0,1)分佈,其機率密度函數為

ϕ(x) = exp(-x2/2)/(2π)1/2xR

物理上量測過程中的步驟很多,每一皆可能產生一微小的誤差。大數學家高斯(Johann Carl Friedrich Gauss1777-1855)的誤差理論,推導出總誤差常有常態分佈。諸如身高、體重及智商等,醫學、生活及自然界裡的很多量,往往可以常態分佈當模式,常態分佈可說處處可見。這是此分佈以常態名之的主因,彷彿若其他分佈出現,便非常態。又,大數法則與中央極限定理最被人稱奇的,是其一般性。只要有一數列獨立且有共同分佈的隨機變數,什麼分佈並無關緊要,當共同的期望值存在,大數法則便適用;當共同的期望值及變異數皆存在,中央極限定理便適用。附帶一提,中央極限定理還有條件更寬鬆的版本,使其適用性更廣。不過實務上,通常上述版本就已夠了。

若想估計期望值μ,經重覆觀測n次後,得到樣本X1X2Xn,則可以樣本平均Sn/n來估計。只要n夠大,由大數法則知,此估計不會太離譜。但我們知道,不論n再大,Sn/n並不會就一直等於μ,至於偏離多遠?只要標準差σ存在,便可以中央極限定理來估計。如習慣用法,以ΦN(0,1)分佈的分佈函數。則n很大時,

(1) P(|Sn/n-μ|≤d)=(P(|n1/2(Sn/n-μ)/σ|≤n1/2d/σ)≈2Φ(n1/2d/σ)-1

由上式得

(2) P(Sn/n-dμ Sn/n+d)≈2Φ(n1/2d/σ)-1

上式常可用來求μ之信賴區間(confidence interval)。底來看一應用。

欲估計一銅板出現正面的機率p,持續投擲n次,得到一數列獨立且有共同分佈的隨機變數X1X2Xn,其中Xi=1,或0,分別表第i次得到正面或反面,i=1n。則

E(Xi) = p

Var(Xi) =(p(1-p))1/2

n很大時,由(2)式,得

(3) P(Sn/n-dp Sn/n+d) = P(p [Sn/n-d, Sn/n+d])

≈2Φ(n1/2d/(p(1-p))1/2)-1 ≥ 2Φ(2n1/2d)-1

此處用到,對0<p<1,必有

(p(1-p))1/2 ≤ 1/2

若欲

2Φ(2n1/2d)-1 ≥ 1-α

其中0<α<1,則

Φ(2n1/2d) ≥ 1-α/2

現取α=0.05,由N(0,1)分佈之機率值表,得Φ(1.96)≈0.975,故約略有2n1/2d ≥1.96。由此得

(4) n ≥ 0.982/d2

d=0.03,由(4)式得n≥1,067.1…。由於n須為整數,得n≥1,068。若投擲數n=1,068,且得Sn=551,則對p之估計值Sn/n=551/1,068≈0.5159。再代入(3)式,得

P(0.5159-0.03≤p≤0.5159+0.03)=P(0.4859≤p≤0.5459)≥1-0.05=0.95

區間[0.4859, 0.5459]便稱為p之一(近似的)95%信賴區間。以一值0.5159估計p(此稱為點估計),有時會忐忑不安,覺得p根本不可能剛好等於0.5159。但以一區間[0.4859, 0.5459] 來估計p,看起來雖不像點估計那麼鐵口直斷,但這樣的估計卻更值得信賴,這是信賴區間一詞的由來。至於有多信賴呢?信心水準(或稱信賴水準、信賴度等)95%

另一方面,由(4)式得d≥0.98/n1/2。有時便採d≈0.98/n1/2。或就簡單些,反正就是近似,一旦知道n,便令

(5) d=0.98/n1/2

以求出估計誤差d。因n=1,068時,d≈0.03,故實際操作時,如果n>1,068,則d<0.03;如果n<1,068,則d >0.03

在上述推導中,有幾處用到不等式。如將(p (1-p))1/21/2取代,這樣會造成誤差嗎?會。但無須擔心,因這樣將使(3)式最左側大於最右側,也就是我們得到的信賴區間,信心水準可能不只95%,說不定還超過。而將n1,067.1…換成1,068,又會使信心水準再稍大些。但這些其實都不必太計較,因即使n再怎麼大,n1/2(Sn/n-μ)/(p(1-p))1/2也不會有N(0,1)分佈,只是近似而已。更何況實務上,樣本數n通常也沒真那麼大,不過1千上下,因而常態近似是否有那麼準確,誰也不敢保證。於是宜保留些,將信心水準說成95%就好了。另外,我們說有95%的信心水準,p會落在區間[0.4859, 0.5459],其中95%是指什麼?機率嗎?有人以為,在取樣前,[Sn/n-d, Sn/n+d]為一隨機區間,那時講p落在此區間之機率為0.95可以。但取樣後,得到Sn之值,前述區間成為一固定區間,此時若說p落在此固定區間之機率為0.95,就沒道理了。因每次投擲會得到不盡相同的Sn,因而得到不盡相同的信賴區間,而怎可能那些不同的固定區間,每一會包含p之機率,皆為0.95?聽起來似乎有理。但別忘了主觀機率,依上述程序得到的區間,若某君覺得就是有0.95之機率會涵蓋p,也沒什麼不行。甚至該君還可反問,此區間有比0.95更適合的涵蓋p之機率值嗎?

附帶一帶,不但對一固定的信賴區間,可談參數落在此區間之機率,只要未知,便可談事件發生的機率。正如懷孕6個月了,胎兒性別根本已定,但不知者仍可猜會生男或生女;考試當天,明明試卷已印製完成,在做最後衝刺的學生,仍可賭某題是否會考。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (LFB1
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2021/12/8 下午 05:20:44

2003/10/20起第 6226956 位訪客
*