國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:談統計素養(五)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2017/1/19 上午 09:57:28

5 估計

2017112日,聯合報有則標題是到底幾歲? 月球比原先以為的更高齡之報導:

根據1971年阿波羅14號太空船採集到的岩石和土壤,最新估算出來的月亮年紀,比先前許多科學家設想的更大:已高齡45.1億歲。

洛杉磯加州大學(UCLA)的研究團隊11日表示,月球在太陽系生成後的6千萬年間形成。先前的估算落在太陽系出現後1億年間,最晚的是2億年。。月球由地球被碰撞後的殘留碎片所形成,科學家估算地球約45.4億歲。巴邦尼說,她正在研究更多來自阿波羅14號樣本的鋯石,但不認為會改變她的估算月球約45.1億歲,最多45.2億歲。他們的報告11日刊登在科學進展"期刊上。

由一些石頭及土,便能對距地球約38萬公里外的月球,估計其年齡,相當厲害。將之前的估計,月球形成於約45億年前,修訂成45.1億年,也就是肯定早先估計的45億年是可靠的,只少了0.1億年。此報導除顯示,估計難免有誤差外,亦可得知,什麼都可拿來估計,包括太空裡星球的年齡。

棒球比賽,緊要關頭,站上打擊位置的球員,會不會成為致勝功臣?他打出安打的機率約為0.22,機會看來不是很大。0.22是如何得到的?由該球員之前的打擊率來估計。看起來合理,機率裡稱此為頻率的觀點。若有人覺得該球員近況很好,過去1個月,平均打擊率有0.43,因此估計他這次擊出安打的機率為0.43,亦無不可。有人出門前,估計今天下雨的機率為0.8。如何得到?看看天色,腦海中就出現0.8這個數字。喔!這是主觀的觀點。只是同樣的天色,不同的人,估計出的下雨機率,可差異很大。路上塞車,這班高鐵趕得上嗎?這支股票會漲嗎?這西瓜甜嗎?生活上人們經常在估計。估計的確該是國民基本的統計素養。無關緊要的事,憑一些現有資料,用些簡單的統計,便能做出估計。有時就要妥善規畫一套估計的程序,以減小誤差。

不但可以有不同的估計法,面對一樣的資料,也可有不同的推論。在黃文璋(2011a)一文裡,我們提到事實至於遺存,推論敬俟卓識",這是考古學家郭寶鈞(1893-1971)所說的,他曾參與多次殷墟挖掘。統計與考古,本質上很類似。考古有物而無言,挖掘固然困難,但目的是給出推論,為古物說故事。統計裡數據取得不易,而一旦蒐集到,數據並未說話,整理分析後,由人負責說話,給出推論。至於那一推論較佳?這便難說了。自一有紅球及白球的袋子中,依序取20球,每次取出後皆放回,結果19次得白球1次得紅球。雖取出之白球比率遠高於紅球,有人仍認為下次取,將會得紅球。頑固嗎?說不定真的取出紅球。對隨機現象的估計或推論,不是以一次準不準,來分高下。得給出評比的準則,才能定下各估計法或推論法之優劣。

前面提到的皆是所謂點估計,即以一值,來估計一未知的量。某日小明考完數學,媽媽問考得如何?大約890吧!有幾成把握?9成。這是典型母子間的對話。由於不太確定閱卷標準,對成績的估計,常不會只給個值,而給個範圍,並附上信心大小。對一隨機現象,估計值並不易精準命中真實值。於是除點估計外,發展出以一區間來估計一未知的量,並附上該量會落在此區間之機率。其中的區間,稱為信賴區間,伴隨的機率,則稱為信心水準。在前述小明的成績估計裡,信賴區間即[80,90],信心水準則為90%

有幾個問題立即會浮現。首先,信賴區間唯一嗎?在估計一未知量時,若採區間估計,常是先給定信心水準,然後求出信賴區間,使該區間涵蓋未知量之機率,如事先所設定的信心水準。信心水準一般以百分比表示,95%90%等,皆是常取的信心水準。對一固定的信心水準,信賴區間往往並不唯一,通常採取區間長度較短的。區間的長度愈短,表估計愈精準。其次,信心水準是什麼意思?95%是代表機率嗎?取樣前信賴區間是一隨機區間,說有95%的機率,包含待估計的參數,這點沒有疑義。取樣後則得一常數區間,此區間要嘛包含參數,要嘛不包含,如何說包含的機率是95%?之前在高中數學裡,師生較不常去想機率究竟是什麼。但自引進信賴區間後,不少人連機率的意義,也開始感到疑惑了。事實上,只要是未知便能談機率。正如考前教師早已出好題了,學生仍可猜題,說這題考的機率有8成,那題不可能考。既然取樣後所得的常數區間,可以對它談機率,則利用主觀機率,將信心水準,視為該區間包含參數的機率,乃再自然不過。

我們說過大學生對信賴區間的涵義,僅一知半解。那何以少聞在大學統計學的課程裡,對信賴區間之學習有何困難?考試引導教學,我們不妨來看一下高中數學裡,信賴區間都考些什麼?

底下為98學年,學測數學的一道多選題:

某廠商委託民調機構在甲、乙兩地調查聽過某項產品的居民佔當地居民之百分比(以下簡稱為知名度”)。結果如下:在95%信心水準之下,該產品在甲、乙兩地的知名度之信賴區間分別為[0.50,0.58][0.08,0.16]。試問下列哪些選項是正確的?

(1) 甲地本次的參訪者中,54%的人聽過該產品。

(2) 此次民調在乙地的參訪人數少於在甲地的參訪人數。

(3) 此次調查結果可解讀為:甲地全體居民中有一半以上的人聽過該產品的機率大於95%

(4) 若在乙地以同樣方式進行多次民調,所得知名度有95%的機會落在區間[0.08,0.16]

(5) 經密集廣告宣傳後,在乙地再次進行民調,並增加參訪人數達原人數的四倍,則在95%信心水準之下該產品的知名度之信賴區間寬度會減半(0.04)

大考中心"公佈的答案為(1)(2)

(3)不在答案裡,此很值得斟酌。我們已說了推論敬俟卓識",但誰又是卓識?依其理念之不同,統計裡可有各種推論,及各種解讀。被視為一意孤行者,還可能自以為擇善固執呢!數學裡就不行,有一套邏輯,不可胡亂推論,隨意解讀。選項(3)既然問此次調查結果可否解讀,光憑問句中的解讀二字,此選項就可判定為正確。何況題目裡說,95%信心水準之下,該產品在甲地的知名度之信賴區間為[0.50,0.58]”。如前指出,採主觀機率,先將題意解讀為知名度有95%的機率,落在區間為[0.50,0.58]。由此得知名度有大於95%的機率是一半以上,因知名度落在[0.50,0.58],都已有95%的機率了。再繼續解讀為甲地全體居民中,有一半以上的人聽過該產品的機率大於95%”,不正是依民調結果,一連串合理的推論嗎?

2017111日,大陸遼寧艦(即遼寧號航空母艦),從海南島返回青島駐地的途中,穿越台灣海峽,引起多方的重視。有人認為是繼1996年大陸試射飛彈以來,對台灣最具挑釁意味的軍事行動;也有人指出,遼寧艦事實上還不具備完整戰力,但穿越台海在台灣內部引發的討論,已經達到中共宣傳戰設定的目標;有人則相信這不過是大陸一個例行性的軍事演習,不必太在意。對此事件,學者專家各有其解讀,只是真相並不易大白。要知解讀與推論,可以相當主觀,很難判定何者正確。因此考題若以可解讀為…”,或可得推論…”,的形式提問,往往缺乏統計的味道。

再來看99學年學測數學的一道多選題:

想要了解台灣的公民對某議題支持的程度所作的抽樣調查,依性別區分,所得結果如下表:

女性公民

男性公民

贊成此議題的比例p^

0.52

0.59

p^的標準差[p^(1-p^)/n]1/2

0.02

0.04

請問從此次抽樣結果可以得到下列哪些推論?

(1) 全台灣男性公民贊成此議題的比例大於女性公民贊成此議題的比例。

(2) 95%的信心水準之下,全台灣女性公民贊成此議題之比例的信賴區間為[0.48,0.56](計算到小數點後第二位,以下四捨五入)

(3) 此次抽樣的女性公民數少於男性公民數。

(4) 如果不區分性別,此次抽樣贊成此議題的比例p^介於0.520.59之間。

(5) 如果不區分性別,此次抽樣p^的標準[p^(1-p^)/n]1/2差介於0.020.04之間。

大考中心公佈的答案為(2)(4)

選項(2)(3)(4),及(5),乃考是否熟悉課本上所給信賴區間的公式。(3)(4),及(5),甚至根本是在考數學。至於選項(1),如前所述,統計考題裡並不適合問可以得什麼推論。不過由所給答案,我們來推敲命題者的用意。調查結果,男性及女性之贊成比例,其95%信賴區間,分別約為[0.51,0.67][0.48,0.56]。由於兩區間有重疊,猜想這可能是(1)不被命題者視為正確選項的原因。但比較二未知比例的大小,並不一定得依靠信賴區間。若採點估計,因0.59>0.52,由此得到(1)之推論不行嗎?即使採信賴區間來相比,非得取95%?採68%不行嗎?而若採68%,則男女贊成比例之信賴區間,便各約為[0.55,0.63][0.50,0.54],不再重疊了。在統計裡,可有各種推論法,且常無那一推論法永遠最佳,只能依不同的標準評比。

在黃文璋(2011b)一文,將98101學年,學測數學,及指考數學甲、數學乙,4年間共12份試題,挑出機率與統計方面,值得商榷的題目來討論。在該文的結論裡,寫著:

。看來信賴區間快沒題目可考了。。現今大學入學考,不論學測或指考的數學科,機率統計的考題,有時像在考三民主義,思想要很制式,才易得高分。

本來估計的教學,就宜以估計為主要目的。想以區間來估計,便該求出信賴區間。大學的統計課裡,在信賴區間那章,有各種分佈,及期望值、標準差,還有它們的函數等,有好幾個參數可估計。於不同的情況下,探討如何求得信賴區間。由於包含的內容不少,因此進度慢不下來,學生匆匆忙忙學習,囫圇吞棗,根本無暇去思考信賴區間的內涵。這是何以多年來,大學信賴區間的教學,少見困擾的主因。並非學生皆能融會貫通,而是問題沒有浮現。但在高中數學裡,就只針對二項分佈B(n,p),要求參數p的信賴區間。以常態分佈來近似,且信心水準設定為95%。內容少,因而求信賴區間的題目,便缺乏變化,加上計算又容易,於是倒過來,先給出信賴區間,然後來解剖該區間,前述那些類型的考題遂產生了。即使在大學教了多年統計學的教授,面對這樣的多選題,都會傻眼。他們何時出過如此型式的考題?學測或指考裡的信賴區間考題,有些教授硬著頭皮去做答,卻不乏5個選項中,錯了好幾個的。雖然這樣,但翻來覆去,畢竟就只有那幾套題型,久後便被高中師生破解,知道命題者想要的答案。思想要正確才易答對,那不就像在考三民主義嗎?也因如此,我們才認為快沒題目可考了。事實上,從102105學年,4年間的學測及指考,除了102學年指考的數學乙,有一道多選題的信賴區間外,便再無信賴區間的考題了。到這個地步,信賴區間是可移出高中了。

有關估計及信賴區間相關的文章,可參考黃文璋(20062007,及2014)三文。

參考文獻

1. 黃文璋(2006)。統計裡的信賴。數學傳播季刊,30(4)48-61

2. 黃文璋(2007)。統計裡的估計。數學傳播季刊,31(2)3-20

3. 黃文璋(2011a)。統計與考古。科學人,118(201112月號)33

4. 黃文璋(2011b)。機率統計考題探討。黃家小館(http://www.stat.nuk.edu.tw/huangwj)

5. 黃文璋(2014)。談信賴區間。翰林數學天地,36(20144月號)7-10

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (2K87
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/5/10 上午 10:49:01

2003/10/20起第 9266413 位訪客
*