國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 線上報名 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:統計入世(四)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2016/9/4 下午 06:25:34

4 若干統計應用實例

2008110日,有一則標題為“O型、射手座、已婚男 最易中彩券型”的報導:

台彩針對過去一年的422位頭獎幸運兒,以及獎金超過5百萬的高額中獎人分析。男性佔4成,4049歲最多,佔32。血型以O型最多,佔44。已婚者佔8成。射手座最有偏財運,水瓶座和牡羊座次之。…。中獎者的職務以“一般職員”佔4成最多,居住地以台北縣兩成最多,台北市19緊追在後,大台北地區合計將近4成,堪稱財神爺最愛的福地。

此報導算不算“數據會說話”?看起來是,或者應說想要是。但是否提供什麼有用的資訊,值得彩券迷重視?

依據台灣血液基金會2012年的統計,台灣的捐血者中,以O型的人最多,約佔44%。假設各血型捐血的熱心程度都差不多,則台灣的人口裡,O型血大約就有44%。事實上,一般估計O型血在台灣,約佔4成左右。如今中獎者血型為O者,佔44%,不正是與人口中,O型血的比例很吻合,怎會是新聞?至於中獎者的星座比例,12個排下來,不會都相等,總有個多寡順序。這次射手座居第一,下次可能換另一個,並不須對偶然排第一的射手座,另眼相看。關於4049歲最多,佔32,及已婚者佔8成等,則應檢視各年齡層,及已婚與未婚等,各族群購買彩券之比例,而非只看各族群之中獎比例。例如,4049歲的中年男子,有可能因孩子尚小,家計較重,在無其他短期能致富的方法下,遂想睹個手氣,因而買彩券的頻率高些。如此佔較高的中獎比例,豈不理所當然?又眾所皆知,台北縣(現改為新北市)的人口數,遙遙領先台灣其他各縣市,中獎比例最高,乃很合理,與財神爺是否最偏愛無關。

為了刺激買氣,彩券發行公司,屢發佈上述這類統計訊息。會不會有人一看,O型、射手座、已婚男、公司職員,及住台北縣,他全滿足,心想太好了,趕快去買彩券吧!恐怕也未必,因長期下來,人們對彩券的中獎情況,多少已有些基本概念。但看多這種新聞後,卻有可能讓人對統計專業,評價不高,以為統計就是用來唬人的,無太多精緻的內涵。又,必須一提的是,在上述討論中,我們假設各血型捐血的比例接近。大膽假設無妨,仍須小心求證。即要經統計檢定,方能確定此假設可否接受,不能只是想當然耳。但無論如何,絕不能由某族群的中獎比例較高,就得到某人若屬該族群,便較易中獎的推論。這涉及條件機率,即對二事件ABP(A|B)不一定等於P(B|A),不可不慎。

201149日,有則標題為“天天逛街 延年益壽”的報導,內容大致是:

逛街有益身心健康,是愛血拼的女士編出的嗎?英國廣播公司(BBC)報導,台灣國家衛生研究院張毓宏博士分析台灣19992008年,185665歲以上獨居老人後發現,每天逛街與不常逛街者相較,前者存活率高27(男性高28%,女性高23%)。顯然這種購物療法(retail therapy)對男性健康更有助益。此結果發表於英國Journal of Epidemiology and Community Health

不想多活幾年的人應很少吧!有何長壽妙方?每天逛街比不常逛街者,存活率高27%,效果看起來很顯著,且逛街不難,此新聞無法不引人注意。尤其該研究報告中還強調:

逛街不一定要花大錢,只要到街上和別人打打交道,看看人群,減少孤寂感,就有助於身心健康。

所以不是錢多者,才能採此逛街增壽法,只要經常上街即可,執行起來又更容易了。不但如此,該研究還指出:

逛街比上健身房更能維持健康,因為和正規運動相比,逛街通常不需強烈激勵,或專業人士指導,因此更容易養成習慣。

上健身房有益健康,這點應能被認同。但健身房並非到處都有,且進場可能要付費。此外,有些器材的使用,初期得有專人指導,以免受傷。想靠去健身房強身,是有些限制。反之,逛街則方便且自在多了。

逛街似乎是想長壽的好方法。甚至也不限逛街,只要不常窩在家裡,樂意“出門和人打交道”,都能達到與逛街可有的長壽效果。愈聽愈吸引人,該起而行,出門去也。但上則新聞刊出的幾天前,201145日,另有則標題為“訃聞會說話韓媒體人壽命短”的報導,內容大致是:

南韓圓光大學保健福祉學系教授金鐘仁,從1963年到2011年媒體發佈的3215名人士的訃聞,及統計廳提供的數據,進行分析,在“保健和福祉”雜誌上公佈各行業的平均壽命。其中宗教人士80歲,政治家75歲,教授74歲,企業家73歲,法律界人72歲,高級公務員71歲,演藝人和藝術人70歲,媒體人、體育界人士及作家皆為67歲。

這是用職業別來比較壽命長短的研究,只是從中似乎看不出“出門和人打交道”可以活得較久些。諸如在演藝圈、媒體,或體育界工作者,不是都得常和人打交道、會看到人群,且較無孤寂感嗎?但據統計,卻都屬於壽命較短者。仔細一想,多出門和人打交道,好處之外,會不會也有缺點呢?例如,常出門是否較容易發生交通事故等意外?至於多和人打交道,是否導致吃喝的應酬也多起來,反不利健康?畢竟天下事,少見僅有利無害者。

就是這樣,在媒體上,經常會看到與我們生活習習相關,數據說話的報導。研究成果能發表在學術期刊,表示已通過專業審查,本該令人重視。但不時有得到的結論,違反一般人的認知;或不同人所做相關的研究,結論不吻合或互相衝突。於是這類報導,遂被當做趣聞者多,被採信者少。至於研究的主持人,對其研究所得,是否真有用,說不定也不太在意。畢竟依研究成果寫出的論文,已發表了,那才是最重要的。於是長期下來,導致有時想採用某項依統計所完成的研究結果,反而會踢到鐵板。見下例。

20168月底,行政院要求位於雲林縣橋頭國小許厝分校遷校。該分校家長代表3百多人,於830日北上至行政院抗議,反對遷校。原來自2013年起,由國家衛生研究院(簡稱國衛院)執行“六輕石化工業區對附近學童健康影響”的研究,發現許厝分校學童尿中的硫代二乙酸(Thiodiglycolic Acid,縮寫TDGA),比許厝分校所在地,雲林縣麥寮鄉的其他4所國小高。於是雲林縣政府,在2014年的上半年,將許厝分校學生,轉到橋頭國小校本部上課。2015年下半年,學生又回許厝分校上課。2016年,國衛院的調查結果發現,2013年及2015年,全國20個行政區,同年齡學生尿中的TDGA濃度,遠低於許厝分校的學生。此結果一出來,再度激起許厝學生暴露化學物質之疑慮。於是在2016822日,行政院衛生福利部,請國衛院提早做期末報告。即使後續尚有待追蹤研究,但考量學生健康,避免暴露在環境汙染危害的風險中,依據期末報告,專家建議不要等了,立即採預防性遷校。

支持遷校的學者表示“數據證實一切”,應以孩子身體為重。但許厝分校的學生家長並不認同,他們質疑國衛院的報告沒有公信力,甚至連汙染源為何,都無法確定。難道汙染是由空而降?至於被懷疑是禍首的台塑公司,則指出該研究報告中,自列多項“研究限制”,包括:

() 研究期間未對任何學童或學校周遭環境進行氯乙烯空氣濃度採樣,無法認定學童尿液中TDGA的確切來源。

() 各校學童的尿液不是在同一天蒐集。

() 當地5所學校學童的尿液採樣季節集中在秋季和春季,風向接近,但重複採樣許厝分校學童尿液時,卻分布在秋季和夏季;台塑認為立足點有差異。

() 調查過程未執行完整的飲食問卷,確認飲食容器或食物對汙染源的影響,對飲水可能的汙染暴露來源也沒有調查。

因此,台塑公司認為國衛院的調查結果,不客觀且不夠周延。簡單講,就是質疑國衛院執行研究時的取樣過程。

數據並不必然能證實一切。統計推論所仰賴的是資料(data),資料常是由一隨機現象所取來的樣本(sample)。如果源頭的樣本,就說服不了人,被認為偏差、有瑕疵,則大花功夫得到的結論,如何能讓人心服?以前述那則“訃聞會說話韓媒體人壽命短”的報導為例。訃聞能上媒體,大抵是名人,因此這是偏差的樣本,若無佐證,其壽命豈能用來代表各行業的平均壽命?要知統計推論與數學推論,乃完全不同。數學上證出三角形三條中線交於同一點(交點稱為重心),只要檢視證明無誤,人們便毫無疑義地接受。由於證明過程中,並非只針對某些特定的三角形,因此不會被質疑所討論的三角形不夠一般,沒有代表性。統計裡的推論,則從取樣、採用的方法,到給出結論,整個過程,都可能受到挑戰。只是樣本的產生,撇開存心作假者外,有時是因思慮不周,導致取得的樣本,有偏差或有瑕疵。但亦有結論未被正確的呈現或使用,導致被誤解,因而降低所得結論的價值。來看底下的例子。

台灣正面臨少子化的危機,不少人或不結婚,或雖結婚卻不生小孩。對此國安問題,憂國之士,相繼獻策。有人以為該先對付那些不結婚者,提出多繳稅的辦法。201265日,媒體上刊出前衛生署長楊志良(1946-)之投書:

我主張單身的朋友多繳一些稅,目的是讓家庭可以少繳一些,減輕負擔、獲得資源,安心養育下一代。等到這些單身的人步入老年,成了需要被照顧的弱勢,當年他們幫忙養育,後來長大成熟的下一代,就成了有能力的人,回過頭來付出、回饋,擔負起社會正常運轉需要的勞動力,以及繳稅等,讓年老的單身朋友可以安心養老,…。

單身不見得是自願,說不定是本身條件不夠好,或擇偶標準過嚴,因此一直找不到對象。已經很鬱卒了,如今居然有人建議要他們多繳稅!但看起來是為他們設想,使老有所養,出於好意。只是單身者領情嗎?

幾天後,2012616日,內政部公佈前一年台灣單身者平均死亡年齡為53.68歲,而有偶者之平均死亡年齡則為70.12歲,單身者比有偶者短少了16.44年的壽命。既然短命而死,那單身者還用擔心養老的問題?少活至少16年,看來不結婚不行了。要鼓勵結婚,這招將比加稅有效多了。等等,前述數據可靠嗎?

對於記者的詢問,內政部戶政司司長表示,這趨勢從過去以來就是如此,國外也有相關的研究指出,單身者可能因較乏人照顧,心理、環境因素都會受到影響,才導致平均餘命比較短。只是單身者平均死亡年齡不足54歲,明顯違反我們的經驗。環顧周遭單身的親友,似乎並未太多是如此短命。這明顯不太對勁的統計結果,那位內政部的高級官員,卻毫不起疑,還理直氣壯。幸好,內政部統計處處長有概念多了,他解釋,因該項統計,乃納入1530歲者之死亡數據,而該年齡層大多未婚,遂拉低單身者之平均死亡年齡。原來如此。

公佈這樣的統計訊息,究竟有什麼參考價值?頗令人懷疑。到頭來,只能在茶餘飯後當趣談。另外,死亡者中多單身,與單身者壽命短,兩件事常大不相同。再度,這又是條件機率P(A|B)不一定等於P(B|A)的問題。

如前述模糊含混的統計報導其實不少,我們再給一例。在一項極大規模對國內大學教育的現況調查報告裡,於學生打工時數那項,得到數學類與統計學類的學系,大一生每星期平均打工時數,各為6.807.78。大一通常修習學分數較多,課業較重,每週還能打工如此長?且初進大學,人生地不熟,又如何個個有辦法找到那麼多的打工機會?看到此報告,有些家長難免會擔心孩子在校的學習狀況。幸好,情形其實並非那麼嚴重。在該項統計圖表下方有行“此時數為有打工者之平均時數”的小註,但字體較小,不太會被注意到。一旁還有圖形顯示,數學及統計學類合計的學系,大一生打工的比率為34%,不過並未給出數學類與統計學類,大一生各自有打工者所佔的比率。學生有打工的比率,這是一相當關鍵的資訊,只是由於圖形不是很明顯,文字中也未強調,有可能會被忽視。如果也納入未打工者(打工時數為0),則大一生的平均打工時數,將大幅降到原本所列時數的三分之一左右。這樣一來,此報告便沒那麼聳動了。

三分之一的學生打工,並不算太多。而學生每星期平均打工兩個多小時,誰會在意啊?呈現結果的方式若不夠周詳,有時便難以正確解讀,如此將降低報告的品質,這是實務上須很謹慎的。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (P8IE
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/6/6 上午 09:38:58

2003/10/20起第 9932570 位訪客
*