國立高雄大學統計研究所-心在南方

:::

:::

主題：統計下凡(三十四)

發表者：黃文璋　Email:huangwj@nuk.edu.tw

日期：2022/1/30 上午 10:10:07

34 信賴區間

我們已介紹了點估計，即以一個數值，來估計一未知的量。但點估計通常不會準確，甚至在很多情況下，估計正確的機率為0，區間估計因應而生。某日小明考完數學，媽媽問他能考幾分？這相當於要小明估計。小明較少會回答諸如85分這種單一值，比較可能說出如8、90這類。這便是區間估計。媽媽懷疑小明過度樂觀，再問有幾成把握？9成！小明充滿信心地回答。幾成把握即表機率有多大。小明便是說，他的分數，會介於80至90分間的機率為0.9。對一隨機現象，其中未知參數之點估計，並不易命中真實值。於是除了點估計外，遂發展出區間估計。即以一區間來估計某參數(表未知的量)，並附上該參數會落在此區間之機率。其中的區間，便稱為信賴區間，至於伴隨的機率(如前述小明說的9成)，則稱為信心水準。在小明的成績估計裡，信賴區間即[80,90]，信心水準則為90%。

曾有人注意到，經濟上的預測，習於只給一明確的值，也就是只採點估計。可能認為給一區間，顯示預測者缺乏信心。而若連自己都沒信心，做出來的預測，豈值得信賴？因而學者或官員，對未來經濟的預測，若以區間估計呈現，往往會被質疑是因信心不足、專業性不夠，或擔心達不到目標而挨罵等。醫生這一行，處境常也類似。有人就是希望醫生給一個斬釘截鐵的答案，如手術成功的機率有幾成？若答5至7成，會被懷疑這樣的模稜兩可，顯然醫術不高明。看起來，是有一些人，並不以為信賴區間值得信賴。至於民調，於公佈調查結果時，除估計值外，亦會給出正負誤差，那就是給估計參數的信賴區間了。何以民調預測這一行，能接受信賴區間？應是大眾已了解民意向來如流水，知道人的想法就是會改變，以區間來表示預測結果，乃是科學的。

信賴區間唯一嗎？這可能是立即會想到的問題。在估計一參數時，若決定採取區間估計，常是先給定信心水準，然後求出一區間，使該區間涵蓋參數之機率，如事先所設定的信心水準。信心水準一般以百分比表示，95%是常取的信心水準，當然99%、90%，或其他百分比都可以。對一固定的信心水準，信賴區間往往並不唯一。那如何選擇？理想狀況當然是取區間長度最短的。區間長度愈短，表估計愈精準，雖有時最短區間並不易找得到。其次，為什麼不說機率，而說信心水準？也就是95%究竟是什麼，代表機率嗎？但又怎能是機率？要知取樣前信賴區間是一隨機區間，說有95%的機率會包含待估計的參數，這點較無疑義。但取樣後則得一常數區間，或者說固定的區間，此區間要嘛包含參數，要嘛不包含，如何能說包含的機率是95%？甚至，若多次重新取樣，將得到多個不同的信賴區間，難道這些不同的區間，每一皆有一樣的機率，涵蓋同一參數？本來人們較不常去想機率究竟是什麼，但接觸信賴區間後，不少人卻連機率的涵義，也開始感到疑惑了。事實上，如我們之前曾提過的，只要是未知便能談機率。正如教室講台抽屜有3個蘋果及2個梨，老師拿了一個放背後，雖究竟是蘋果或梨乃確定，仍可問學生是蘋果的機率為何？又如考前老師早已出好題了，學生仍可猜題，說這題8成會考，那題會出現的機率連0.01都不到等。再如單位裡某人氣相當旺的女同事，懷胎9月即將臨盆，雖肚子裡的寶寶性別早已確定，但好事者仍屢在猜測她生男或生女的機率。同理在估計銅板出現正面的機率p時，由於p未知，因而取樣後所得的一個固定信賴區間，是可以對它談機率，即會包含p的機會為0.9，或0.95等。其實就是用主觀機率，將信心水準，視為該區間包含p的機率，而這乃合情合理。

假設某廠牌電池的壽命有常態分佈N(μ,σ²)。由於製程穩定，變異數σ²可設為已知。現欲估計期望值μ。取n個電池來測試，得X₁，X₂，…，X_n，分別表各電池之壽命，可假設為相互獨立且以N(μ,σ²)為共同分佈，因而S_n/n有N(μ,σ²/n)分佈，其中S_n=X₁+X₂+…+X_n，n≥1，為樣本和，而S_n/n當然便是樣本平均。由於(S_n/n-μ)/(σ/n^1/2)有標準常態分佈N(0,1)。故

P(-1.96σ/n^1/2≤(S_n/n-μ)≤1.96σ/n^1/2)≈0.95，

其中1.96是由95%的信心水準而來。上式導致

P(S_n/n-1.96σ/n^1/2≤μ≤S_n/n+1.96σ/n^1/2)≈0.95。

由是得μ之一(近似的)95%信賴區間為

[S_n/n-1.96σ/n^1/2, S_n/n+1.96σ/n^1/2]。

上述區間之長度為3.92σ/n^1/2，可看出n愈大時，區間長度愈短，且n→∞時，3.92σ/n^1/2→0。付出代價愈高(樣本數愈大)，可得愈精準的估計。由此也可看出，至少對不同的樣本數，信賴區間並不唯一。

我們給的信賴區間乃對稱於μ，可否不對稱於μ？可以，但對常態分佈，只要同一n，不對稱的信賴區間，便非最短。如因

P(-1.8814σ/n^1/2≤(S_n/n-μ)≤2.054σ/n^1/2)≈0.95。

由是得μ之一(近似的)95%信賴區間為

[S_n/n-2.054σ/n^1/2, S_n/n+1.8814σ/n^1/2]。

上述區間之長度為3.9354σ/n^1/2，比原本的3.92σ/n^1/2長些。事實上，在本例中，有無限多個μ之95%信賴區間，而對稱的那個最短。

當σ未知時，對μ的估計，有不同的作法；而也能估計σ²，也是分μ已知或未知，有不同的信賴區間；又，亦可同時估計(μ,σ²)之信賴區間。另外，對不同分佈的參數，也可給出參數估計之信賴區間，在此均略過不提。統計裡的分佈很多，即使常用的都有十餘種，每種的參數從1到3個都有，甚至更多。由於隨機變數和的分佈，多半無簡潔的形式，故常得藉助中央極限定理，求出近似的信賴區間。因而大學裡有關信賴區間的章節，琳琅滿目，涉及各種分佈及各種分佈的估計，有夠多的題材可討論。另一方面，之前已學過點估計，學生不難輕易接受區間估計，因不過是點估計的擴展。至於中央極限定理，也在之前便已學過了。因而在大學統計裡，信賴區間並非一個會太讓學生感到深奧的題材。當然可能會覺得，求一個又一個不同分佈及不同參數之信賴區間，有點繁瑣。

暫無回應

回本區首頁

回應總數0

姓名：	回應前，請先註冊或登入。
E-mail：
內容：
驗證碼：	（S7WE）

:::

地　　址：811高雄市楠梓區高雄大學路700號
電　　話：07-5919362 傳真：07-5919360 e-mail: stat@nuk.edu.tw
更新日期：2024/4/11 上午 09:16:10

2003/10/20起第

9061376

位訪客