國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:統計下凡(三十四)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2022/1/30 上午 10:10:07

34 信賴區間

我們已介紹了點估計,即以一個數值,來估計一未知的量。但點估計通常不會準確,甚至在很多情況下,估計正確的機率為0,區間估計因應而生。某日小明考完數學,媽媽問他能考幾分?這相當於要小明估計。小明較少會回答諸如85分這種單一值,比較可能說出如890這類。這便是區間估計。媽媽懷疑小明過度樂觀,再問有幾成把握?9成!小明充滿信心地回答。幾成把握即表機率有多大。小明便是說,他的分數,會介於8090分間的機率為0.9。對一隨機現象,其中未知參數之點估計,並不易命中真實值。於是除了點估計外,遂發展出區間估計。即以一區間來估計某參數(表未知的量),並附上該參數會落在此區間之機率。其中的區間,便稱為信賴區間,至於伴隨的機率(如前述小明說的9),則稱為信心水準。在小明的成績估計裡,信賴區間即[80,90],信心水準則為90%

曾有人注意到,經濟上的預測,習於只給一明確的值,也就是只採點估計。可能認為給一區間,顯示預測者缺乏信心。而若連自己都沒信心,做出來的預測,豈值得信賴?因而學者或官員,對未來經濟的預測,若以區間估計呈現,往往會被質疑是因信心不足、專業性不夠,或擔心達不到目標而挨罵等。醫生這一行,處境常也類似。有人就是希望醫生給一個斬釘截鐵的答案,如手術成功的機率有幾成?若答57成,會被懷疑這樣的模稜兩可,顯然醫術不高明。看起來,是有一些人,並不以為信賴區間值得信賴。至於民調,於公佈調查結果時,除估計值外,亦會給出正負誤差,那就是給估計參數的信賴區間了。何以民調預測這一行,能接受信賴區間?應是大眾已了解民意向來如流水,知道人的想法就是會改變,以區間來表示預測結果,乃是科學的。

信賴區間唯一嗎?這可能是立即會想到的問題。在估計一參數時,若決定採取區間估計,常是先給定信心水準,然後求出一區間,使該區間涵蓋參數之機率,如事先所設定的信心水準。信心水準一般以百分比表示,95%是常取的信心水準,當然99%90%,或其他百分比都可以。對一固定的信心水準,信賴區間往往並不唯一。那如何選擇?理想狀況當然是取區間長度最短的。區間長度愈短,表估計愈精準,雖有時最短區間並不易找得到。其次,為什麼不說機率,而說信心水準?也就是95%究竟是什麼,代表機率嗎?但又怎能是機率?要知取樣前信賴區間是一隨機區間,說有95%的機率會包含待估計的參數,這點較無疑義。但取樣後則得一常數區間,或者說固定的區間,此區間要嘛包含參數,要嘛不包含,如何能說包含的機率是95%?甚至,若多次重新取樣,將得到多個不同的信賴區間,難道這些不同的區間,每一皆有一樣的機率,涵蓋同一參數?本來人們較不常去想機率究竟是什麼,但接觸信賴區間後,不少人卻連機率的涵義,也開始感到疑惑了。事實上,如我們之前曾提過的,只要是未知便能談機率。正如教室講台抽屜有3個蘋果及2個梨,老師拿了一個放背後,雖究竟是蘋果或梨乃確定,仍可問學生是蘋果的機率為何?又如考前老師早已出好題了,學生仍可猜題,說這題8成會考,那題會出現的機率連0.01都不到等。再如單位裡某人氣相當旺的女同事,懷胎9月即將臨盆,雖肚子裡的寶寶性別早已確定,但好事者仍屢在猜測她生男或生女的機率。同理在估計銅板出現正面的機率p時,由於p未知,因而取樣後所得的一個固定信賴區間,是可以對它談機率,即會包含p的機會為0.9,或0.95等。其實就是用主觀機率,將信心水準,視為該區間包含p的機率,而這乃合情合理。

假設某廠牌電池的壽命有常態分佈N(μ,σ2)。由於製程穩定,變異數σ2可設為已知。現欲估計期望值μ。取n個電池來測試,得X1X2Xn,分別表各電池之壽命,可假設為相互獨立且以N(μ,σ2)為共同分佈,因而Sn/nN(μ,σ2/n)分佈,其中Sn=X1+X2+…+Xnn≥1,為樣本和,而Sn/n當然便是樣本平均。由於(Sn/n-μ)/(σ/n1/2)有標準常態分佈N(0,1)。故

P(-1.96σ/n1/2≤(Sn/n-μ)≤1.96σ/n1/2)≈0.95

其中1.96是由95%的信心水準而來。上式導致

P(Sn/n-1.96σ/n1/2μSn/n+1.96σ/n1/2)≈0.95

由是得μ之一(近似的)95%信賴區間為

[Sn/n-1.96σ/n1/2, Sn/n+1.96σ/n1/2]

上述區間之長度為3.92σ/n1/2,可看出n愈大時,區間長度愈短,且n→∞時,3.92σ/n1/2→0。付出代價愈高(樣本數愈大),可得愈精準的估計。由此也可看出,至少對不同的樣本數,信賴區間並不唯一。

我們給的信賴區間乃對稱於μ,可否不對稱於μ?可以,但對常態分佈,只要同一n,不對稱的信賴區間,便非最短。如因

P(-1.8814σ/n1/2≤(Sn/n-μ)≤2.054σ/n1/2)≈0.95

由是得μ之一(近似的)95%信賴區間為

[Sn/n-2.054σ/n1/2, Sn/n+1.8814σ/n1/2]

上述區間之長度為3.9354σ/n1/2,比原本的3.92σ/n1/2長些。事實上,在本例中,有無限多個μ95%信賴區間,而對稱的那個最短。

σ未知時,對μ的估計,有不同的作法;而也能估計σ2,也是分μ已知或未知,有不同的信賴區間;又,亦可同時估計(μ,σ2)之信賴區間。另外,對不同分佈的參數,也可給出參數估計之信賴區間,在此均略過不提。統計裡的分佈很多,即使常用的都有十餘種,每種的參數從13個都有,甚至更多。由於隨機變數和的分佈,多半無簡潔的形式,故常得藉助中央極限定理,求出近似的信賴區間。因而大學裡有關信賴區間的章節,琳琅滿目,涉及各種分佈及各種分佈的估計,有夠多的題材可討論。另一方面,之前已學過點估計,學生不難輕易接受區間估計,因不過是點估計的擴展。至於中央極限定理,也在之前便已學過了。因而在大學統計裡,信賴區間並非一個會太讓學生感到深奧的題材。當然可能會覺得,求一個又一個不同分佈及不同參數之信賴區間,有點繁瑣。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (EQ60
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/5/16 上午 09:00:18

2003/10/20起第 9643460 位訪客
*