國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:統計下凡(十一)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2021/8/22 下午 12:16:45

11 百分位數

行政院主計總處,於20201223日,發布一則標題為“108年工業及服務業受僱員工全年總薪資中位數及分布統計結果”之新聞,新聞稿中提到,“2019年工業及服務業全年總薪資第1十分位數為29.1萬元,較107年增加4.10%;第9十分位數為117.9萬元,則增加2.62%”。其中第1十分位數,即第10百分位數,第9十分位數,即第90百分位數。在有關薪資的報導,有時除中位數(50百分位數)外,會更細緻地給幾個特別的百分位數,以讓人們更加了解薪資結構。有助解讀數據,百分位數一詞,本就讓一般人不會覺得太陌生。過去二十餘年,由於學測(大學入學學科能力測驗)的頂標、前標、均標、後標,及底標等5標,乃分別依到考生之第8875502512等百分位數之級分而定,及基測(國民中學學生基本學力測驗,2013年舉行最後一屆,之後由會考(國中教育會考)取代)PR(percentile rank,百分等級)值,讓人們更常接觸到百分位數。

或許是因太常在媒體出現,所以百分位數,被認為是國民必須懂的統計概念。在之前的“9年課綱”裡,中位數及百分位數等題材,置於國中3年級。經過多年,其中的中位數,可能是因被認為較簡單,在“12年課綱”裡,由國中3年級移至1年級;至於百分位數,應是被認為較難吧,則移至高中1年級,列在“數據分析”項下,於“學習內容”(學習內容條目及說明)欄位中寫著,“一維數據的平均數、標準差。二維數據的散布圖,最適直線與相關係數,數據的標準化。”就這樣而已?並沒出現“百分位數”一詞啊!這是數學課綱的習性,究竟要學些什麼,不能只看“學習內容”。只是該學習的內容,怎能不放在“學習內容”欄位裡呢?有關百分位數,其實放在前述“數據分析”那項之“備註”欄位裡(雖是數學課綱,但向來不能跟它追究邏輯):“適度與國中所習的數據分布圖重疊,但加深加廣其情境,並將四分位數延伸至百分位數。學生應知道統計數據可能有略為不同的定義,也應理解可能產生數值略為不同但意義相同的數據;…。”在“學習內容”欄位裡,只提到平均數及標準差二詞,然後在“備註”欄位中,憑空冒出四分位數,且說要延伸至百分位數。課綱將部分該學習的內容,放在“備註”欄位中,古人說綱舉目張,如今綱目不分了。又,在那句“產生數值略為不同但意義相同的數據”中,提到“意義相同”,但究竟是什麼意義跟什麼意義相同?並無法理解。至於四分位數又是什麼?

12年課綱”的國中3年級,在“統計數據的分布”項下,於“學習內容”欄位中寫著,“全距;四分位距;盒狀圖”。在該項之“備註”欄位裡有,“…,本條目則傳達以盒狀圖描述數據的集中程度。”只是尚未引進百分位數,四分位數會容易定義嗎?令人存疑。我們列出“課程手冊”中,該項之基本說明的第(2)及第(4)點如下:

(2). 認識第1、第2、第3四分位數(可記為Q1Q2Q3)的意義,知道如何運用資料的累積相對次數分配表來找出Q1Q2Q3。知道第2四分位數即為中位數;四分位距則為第3四分位數與第1四分位數的差,即Q3-Q1

(4). 關於四分位數的定義,一般並沒有統一的取法,很多處理資料的統計軟體所用的四分位數定義也不一樣。因此學生應先確切學習取四分位數的原理,再學習其計算法則。

此二點均令人疑惑。先含混地在第(2)點說,以“累積相對次數分配表”找出Q1Q2Q3,然後在第(4)點說,“統計軟體所用的四分位數定義也不一樣”。只是就算有不一樣的定義,那至少該給一個吧!沒有,一個也不給。另一方面,要學生“先確切學習取四分位數的原理,再學習其計算法則”。但原理是什麼?計算法則又是什麼?這些卻都不講,似有故弄玄虛之嫌。而雖然沒給定義,“課程手冊”中倒是有給一“釋例”。一班有30個學生之數學段考成績(我們將成績由小到大排列)如下:

53335353643444547485255586464656869707475787879808283848589

然後立即給出“最大數與最小數分別為895,所以全距為84。以及Q1Q2Q3分別為4564.578,則四分位距為Q3-Q1=33”。至於Q1Q2Q3如何求出,並沒說。看起來“課程手冊”之編寫者,有可能不認為在引進百分位數之前,適合講四分位數此題材,乾脆只給答案,至於如何得到則不講。附帶一提,Q1Q2Q3,即分別為第2550,及75百分位數。但國中數學裡,有什麼必要放進一無法明確給出定義的四分位數?而突兀地講授四分位距及盒狀圖的目的何在?這些都相當令人不解。

在“9年課綱”的“標準用詞與解釋”裡,說百分位數是,“各筆或各組資料的相對位置,表示有百分之多少的資料比該筆或該組資料的數要小”。這定義與一般的認知大不相同。依此定義,設有數據12,…,100。則51是中位數(50百分位數),但50卻非中位數,相當奇怪。其他更不要說第1百分位數為2,…,第99百分位數為100了。

前面說過,在“12年課綱”的高中1年級,於“數據分析”項的“備註”欄位裡說,“將四分位數延伸至百分位數”。但其實沒什麼好延伸的,先教百分位數才較恰當。“課程手冊”裡,關於此部分寫得相當長。在“相關約定”的(1)裡寫著,“數據資料的第m百分位數記作Pm,其中m為正整數12,…,99。其詳細約定,寫在釋例中。”但不知為何,在“釋例”裡並無“例”,只說Pm指的是同時滿足以下兩條件的數,“小於或等於Pm的資料數量至少占全部資料量的m%;大於或等於Pm的資料數量至少占全部資料量的(100-m)%。當資料中恰有一個滿足上述條件的(原始)數據時,採用它作為Pm;當超過一個(原始)數據滿足上述條件時,取它們的平均值作為Pm至於四分位數,則連提都不提,所以“將四分位數延伸至百分位數”之議題,完全被拋開了。

依上述“課程手冊”之“釋例”,再度來看這組相當普通的數據12,…,100。由第1個條件,立即得P1=12P2=23,…,P50=5051,…,P99=99100,再由第2個條件,得P1=1.5P2=2.5,…,P50=50.5,…,P99=99.5。雖依“釋例”,求出了百分位數,只是這樣的百分位數,與一般人所想的很可能不同。既然是12,…,100,大部分的人可能想當然耳地會以為,P1P2,…,P99,分別是12,…,99。很難想像會冒出1.52.5,…,及99.5等為百分在數。

換組數據來看。假設有數據12,…,99,即將上筆數據去掉最大那數100。得P1=1P2=2P3=3,…,P50=50,…,P99=99。有趣的是,一旦數據少掉1個,百分位數便能皆如一般人新預期了

再看一筆數據12,…,50。先得P1=1P2=12P3=2P4=23,…,P50=2526,…,P98=4950P99=50。當m是奇數時,Pm只有一個值;當m是偶數時,Pm有兩個值。由此得P1=1P2=1.5P3=2P4=2.5,…,P50=25.5,…,P98=49.5P99=50。除P1P99,及中位數外,其他百分位數,可能讓人有些糊塗吧!

對數據12345,先得P1=P2=…=P19=1P20=12P21=P22=…=P39=2P40=23P41=P42=…=P59=3P60=34P61=P62=…=P79=4P80=45P81=P82=…=P99=5。由此即得P20=1.5P40=2.5P60=3.5P80=4.5,其餘不變。除4個外,其他百分位數,都是多個取同一值。

在“9年課綱”的細目銓釋”裡,於“能認識百分位數的概念”項下,有5點說明,其中第2點為,知道百分位數通常用於分析總次數多的資料,避免在資料數少的例子中,做百分位數的教學。”上述幾個例子顯示,數據若太少,一目了然,本不需藉百分位數來解讀數據,此時若仍要求百分位數,是可以求出,只是不但不會讓數據更清楚,反而可能讓人覺得百分位數礙手礙腳。那數據較多時會如何呢?底下給一之例。

假設NBA球員有450位,按年薪由低至高排序,第1-4位,年薪各20(美元,底下同),第5位,年薪80萬,第447-450位,年薪各4.5千萬,第446位年薪3.5千萬。則依上述“釋例”,可求出P1=80萬,至於那420萬,對求P1毫無影響;另外,P99=3.5千萬,至於那44.5千萬,對求P99也毫無影響。於是在人們對NBA球員年薪的理解裡,低薪被拉高,高薪則被拉低。又,P2為第9與第10位之年薪,所以是二者之平均,P3為第14位之年薪,…。有很多球員的年薪被棄而不用,對百分位數沒有貢獻。但對沒學過,或不記得中學數學裡的中位數者,可能會將最低5位球員的年薪平均,當做P1,第6位至第9的年薪平均,當做P2,…,第446位至第450位的年薪平均,當做P99,這樣說不定更符合百分位數的精神呢!由本例知,即使數據較多,百分位數也不見得能大展長才,有效讓人了解數據。也就是百分位數,並不易有一能處處令人完全滿意的定義。

百分位數常用在薪資。政府每年會公佈前一年國民所得,也會列出一些特別的百分位數。但怎樣叫所得?打工、租屋、擺地攤,及網路交易等,政府都能精確掌握嗎?究竟列入考慮的,是900萬人,或11萬人?不同單位所做的統計,差異可能很大。因此其中的百分位數到底如何產生,若太去計較意義並不大。反正只是想讓人約略了解國民所得,究竟高到那裡去,以及低到那裡去。講起來就是件差不多之事,無法也不必過於去深究。這樣不求弄得太清楚的題材,說起來,並不適合出現在講求精準之中學數學課程裡。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (8040
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/4/11 上午 09:16:10

2003/10/20起第 9052776 位訪客
*