國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:統計下凡(十)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2021/8/15 下午 12:14:24

10 中位數

北美有四大職業運動聯盟,除NBA外,尚有NFL (National Football League,國家美式足球聯盟)MLB(Major League Baseball,美國職業棒球大聯盟),及NHL(National Hockey League,國家冰球聯盟)。若依聯盟的收入及影響力等來評比,NBA在四大聯盟裡,大約會落到第三。不過,若論球員薪資,NBA卻是排名第一。只是NBA45百個球員,如何呈現球員之薪資呢?數據的代表值,最先想到的很可能是平均。但平均是球員薪資之恰當的代表值嗎?

20201217日,有媒體報導,“依網站Statista的資料,四大聯盟中,今年(2020)賽季的球員平均年薪,以NBA球員的832萬美元居首,而且是平均年薪第二名MLB403萬美元之兩倍以上。”雖被公佈平均年薪高達832萬美元(以今日匯率,約2.3億台幣),但大多數的NBA球員,很可能會抱怨,大眾被平均誤導了,他們的收入遠比平均低多了。是這樣嗎?沒錯!同年418日有另一則報導,其中提到,“NBA現役有450位球員,…。2017NBA球員平均年薪是693.6154萬美元,年薪中位數(median)250萬美元,2019-2020球季的最低年薪則是89.331萬美元,低收入球員和頂薪球員間有極大差距。”報導中透露年薪中位數才約平均年薪的36.04%。再前一年(2019)122日,則有如下報導,“NBA再一次成為全世界球員平均年薪最高的聯賽,達到777.1萬美元;年薪中位數為432萬美元。”在此則報導裡,年薪中位數沒低那麼多,但也才約平均年薪的55.59%。我們再給一2018224日的報導,“2017-2018賽季,NBA在球隊領薪水的共計有548人次(包括少數拿多份工資的)。而本賽季,NBA總薪資為33.5億美元,去掉短工(收入30萬以下的),還有495名球員,人均薪水677萬美元…。我們看中位數,其中薪資排第248名的球員年薪329萬美元(拿同樣年薪的共計有4名球員)。”其中指出球員薪資的中位數,約為平均年薪的48.60%。又第248名剛好居全部495名的正中間,即說明中位數,乃排名“居中那位”。

也許年份及計算的基準不同,因連30支球隊的球員總數,都有548495,及450等數字,上下差了將近1百人,導致前述數筆NBA球員年薪之平均及中位數,有不小差異,便不足為奇了。但3處提到年薪中位數,皆比平均年薪少很多,更有兩處的中位數連平均之半都不到。不難理解,這主要是因有些明星球員,年薪高達45千萬美元(甚至年薪還不是其主要收入,更多收入來自廣告代言等場外收入),一支球隊中,兩個大牌球員的年薪(其高薪即所謂極端值),常便超過全隊其他球員的年薪和,遂將球隊整體平均年薪大幅拉高。因而對職業運動,平均年薪往往不是球員薪資之最恰當的代表值,中位數才是。求一筆數據之中位數,看起來很簡單,只要將數據排序即得,不像平均,還要先求總和。

中位數常可消除極端值的影響。例如,對12345,平均及中位數皆為3;但對12345,000,平均為1,002,那一特別大的數5,000,讓平均數增大不少,但未更動中位數,仍為3

再來看一則國內的報導。20201223日,行政院主計總處發布標題為“108年工業及服務業受僱員工全年總薪資中位數及分布統計結果”之一則新聞,其中提到,“2019年工業及服務業受僱員工全年總薪資中位數為49.8萬元,…。薪資中位數是將員工依薪水由低至高排序,位處中間者的薪資即為薪資中位數,因此相較平均數容易受極端值影響,中位數更能反映多數民眾的薪資狀況。…,2019年全體工業及服務業受僱員工數為796.7萬人,薪資中位數為49.8萬元,意即有半數受雇員工年薪未達此水準,約398萬人。”其中說明為何採中位數,及中位數乃“位處中間”那數。

生活裡,人們求平均的機會多,求中位數的機會少,但直觀上,中位數就是正中間那數,倒不是困難的概念。學生時代,自小學起,便不時會按高矮排隊型,那時並未太在乎精準度,以目測差不多即可。身高居中的是那個?如果9個人,就正中間那位,即第5個的人之身高。如果10個人呢?沒有唯一的中間,那就中間兩位,即居第5及第6的兩個身高,都可算居中,反正差不了太多。若只能給一值呢?便取中間兩人身高之平均,還是同一句話,反正差不了太多。一般而言,設數據個數為n,將數據按小至大排序後,當n為奇數時,令第(n+1)/2個值為中位數;當n為偶數時,則第n/2,及(n+1)/2個,皆可為中位數,或者取第n/2,及(n+1)/2個之平均為中位數。當n為偶數時,若依第一個定義,中位數為數據中的某兩個;若依第二個定義,中位數乃唯一,但並不屬數據中的任一個。

其實人們對中位數如何產生?通常並不太計較。在求NBA球員年薪的中位數時,往往連球員總數,都搞不定,上下可差到約百人,因而正中間究竟是那位,並不易確定。另外,因受傷而整年沒上場的球員,其薪資又如何採計?於是在看到報導中的NBA球員年薪之中位數時,很少人會去過問計算基準。反正只是個參考,想對球員年薪,有個約略的概念而已。此正如有些人在談到自己年薪時,會思考一陣子:加班費及績效獎金等算不算?每月被扣除的午餐、交通車及退撫儲金等費用,要不要加回來?連自己年薪究竟有多少,都要想一想該講那個值,因而對所見到之各種中位數,便未太追究其涵意。即使如此,“居中那位”,或“位處中間”之概念,大家還是有的。

生活中離開不了統計,媒體上經常可看到各種統計數據的報導,其中不乏百分位數(percentile)及中位數等。百分位、中位,字面上看,令人覺得淺顯易懂,於是便出現在國中數學了,並歸入統計領域。先看“中位數”?在之前,2008年通過,且自2010年開始實施的“9年課綱”(九年一貫數學課綱)裡,中位數放在國三。在“細目銓釋”(分年細目銓釋)裡有,“能認識平均數、中位數與眾數;能認識全距及四分位距,並製作盒狀圖;能認識百分位數的概念,並認識第1025507590百分位數”。對於中位數,於“分年細目銓釋”裡,捨“居中那位”及“位處中間”,相當口語地說,中位數是將資料排序後,前後各切一半的中間位置資料值。中位數會使落在兩邊的資料呈現出某種平衡狀態。…中位數則是個數的平衡。”呈現出某種平衡狀態”,有點文青的寫法,但個數究竟如何平衡?並沒明說。這就算了,依此定義求中位數,卻時感困惑。例如,對於數據個數為偶數,如123456,前後各切一半,有一半是123,另一半是456,中間位置3.5,是這樣嗎?因提到要有平衡狀態,那看來就是3.5了。但對於數據個數為奇數,如12345,中間位置顯然為3,但此時如何前後各切一半?將3這個數字劈為兩半嗎?這種“所羅門的審判”(The Judgement of Solomon,典故見“舊約聖經”“列王紀上”第3章第16-28)式的用語,看似豪邁,卻只有數據個數為偶數時,中位數才求得出。不得不說此定義並不周詳。但定義不妥的,並不僅止於此。

中位數為百分位數之一種,即第50百分位數。在“9年課綱”的“用詞解釋”(標準用詞與解釋)裡,便藉百分位數來引進中位數。即“第50百分位數,通常表示比這筆或這組數大和比這筆或這組數小的資料各佔一半”。依此定義,我們來重新檢視前述2筆數據。對12345,顯然3不是中位數了,因比3大及比3小,各有2個數,並不佔5個數之半,即2.5個。此顯示當數據個數為奇數時,依“用詞解釋”,根本不會有中位數存在。其次對123456,顯然區間(34)中的任一數皆為中位數,但端點34則皆不是。也就是數據個數為奇數時,中位數並不存在;數據個數為偶數時,中位數不但不唯一、有無限多個,且沒有一個在數據中。中文裡,銓釋”與“解釋”不知有何差別,但在同一份課綱的“分年細目銓釋”及用詞解釋”裡,給出迥然不同的中位數之定義,且二者在數據個數為奇數時皆窒礙難行,未免太奇怪。

幸好,在教育部主編,201212月出品,針對“9年課綱”的“補救教材”(國中數學基本學習內容補救教材)中說,“甚麼是‘中位數’呢?通常對於給定的一組資料,將資料的數值由小到大排列,(1)若資料個數是奇數個,則最中央的一個資料數值是中位數,(2)若資料個數是偶數個,則最中央的兩個資料數值的平均值是中位數”。當然將資料的數值由大到小排列亦可。今日國中,大致便採此中位數唯一之定義。依此,只要給定一組數據,可明確求出其中位數。這的確是份“補救”教材,因中位數的定義,終於弄清楚了。這樣講實在有點難堪,因中位數不是本就該如此定義嗎?在媒體的報導裡,中位數不一向就是這麼解釋的嗎?最多就是當數據有偶數個時,中位數須唯一或允許可以有兩個之別。如今大費周章編出來的課綱,卻需要補救?依“補救教材”,即使數據裡有重覆的,仍可找出中位數。如對數據11112,中位數為1;對111222,中位數為12之平均,即1.5

底下再給一常見的中位數之定義。對一組數據,若在某值之前及之後,皆至少有50%個,則該值便為此組數據之中位數。如一般用法,這裡的“之前”及“之後”,都表包含該值。依此定義,對12345,顯然3為中位數;而對123456,顯然34皆為中位數。甚至若允許中位數不在該組數據中,則區間[34]中的每個數,便皆為中位數。此定義可行,當數據個數為奇數時,中位數唯一;當數據個數為偶數時,中位數有無限多個。

繼“9年課綱”後,2019年開始實施的“12年課綱”(十二年國教課綱,又稱108課綱),數學在國中1年級有,“統計數據:用平均數、中位數與眾數描述一組資料的特性;使用計算機的M+或Σ鍵計算平均數”。中位數的定義,在這份新課綱裡有釐清楚嗎?

課綱向來寫得簡略,常連微言大義都稱不上。在針對“12年課綱”完成的補充材料“課程手冊”(數學領域課程手冊,20202月,國家教育研究院發行,共765)裡,再度出現“中位數是將資料排序後,前後各切成一半的中間位置資料值”。此顯示編寫這份“課程手冊”者,仍喜愛各切成一半的豪邁講法,當能也可能是照抄舊課綱裡的資料。我們已說明了,依此定義,當數據個數為奇數時,中位數不存在。幸好,“12年課綱”公佈後,國中數學課本的編輯,知道不必理會“課程手冊”,守住“9年課綱”時代,“補救教材”裡中位數之定義,而不讓中位數困惑師生。數學課綱裡的中位數,不知要到那一年的版本,才能停止需要補救。

有些數學家不習於動手,十年來,不但未曾依自己給的,各切成一半之定義去求中位數,對媒體上不時出現的報導裡,特地附上中位數的意義,可能也未曾仔細看。原本“9年課綱”國中裡的中位數及百分位數,長期引起的學習困難,解決之道,居然僅是在“12年課綱”裡,保留中位數在國中,而將百分位數移至高中,但對中位數的講法卻維持不變,頗有鋸箭法之風格。高中裡的百分位數,會被寫成什麼樣子,不禁令人忐忑不安。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (R9TH
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2021/12/8 下午 05:20:44

2003/10/20起第 6227014 位訪客
*