統計與棒球

黃文璋教授

國立高雄大學應用數學系

1、華山論劍

        不分中外,自古即知發表著作(詩詞、文章或書籍)的重要。即使辛苦地用刀刻或寫在羊皮上,人們仍是儘量將當時的一些思想結晶,設法留給後代。經過歷史的考驗,有些著作至今仍閃亮發光,因而讓我們對作者不辭艱難地將當時智慧的心血傳下來,充滿著感激(雖然不少古籍的作者是誰往往並非很清楚)。如論語、孟子、史記等,及西方的聖經、幾何原本等。又如唐朝一代,不知產生多少出色的詩,歷代唐詩的選本也不少,但最膾炙人口的要算蘅塘退士的唐詩三百首了。我們透過唐詩三百詩來了解唐人的情操和意境。而能被選進此選本的詩也都是經過千錘百鍊,為名家一致公認為好詩的。我們固然要感激原詩的作者,也要感激蘅塘退士。

        美國耶魯大學 (Yale University)的Phillips教授等人,依據九份被公認很好的刊登統計理論的學術期刊,對全世界的學術單位及個人排名,全文見Phillips et al.(1988)。

 他們選定的九份期刊是Annals of Statistics,Biometrika,Econometric Theory, International Statistical Review,Journal of the American Statistical Association(簡稱JASA), Journal of Multivariate Analysis,Journal of the Royal Statistical Society(簡稱JRSS) Series B,Journal of Time Series Analysis,及Sankhya Series A,時間是從西元1980至1986的七年間。他們承認所選的期刊是很主觀的,雖已儘量包含刊登統計理論的期刊,但仍有一些重要的期刊未包含進去,如Annals of the Institute of Statistical Mathematics,the Australian Journal of Statistics及Scandinavian Journal of Statistics。一些較應用的期刊,如Technometrics及Biometrics,以及較偏重機率的期刊也未包含進去。

在他們的排法裡,一篇文章若有n位作者,則每位各得n分之一的分量。每份期刊的頁數也依該期刊每頁的字數多寡,給一適當的加權因子,而以Annals of Statistics的一頁當做標準頁數1。例如,JASA每頁相當於1.96標準頁,Sankhya Series A 每頁相當於0.75標準頁,因此一篇登在JASA上的20頁文章,便相當於39.2頁的標準頁,餘類推。

依照前述辦法,他們算出全世界各單位及各人發表的頁數,然後做各種排名。其中有兩個排名是前50名的作者,分別依九份期刊及Annals of Statistics按頁數多寡排。在表1及表2中,我們列出此二排名之第一名及其中的中國人。之所以又單獨給Annals of Statistics排名,是因這是統計界一份相當有份量的期刊。兩種排名的第一名均為澳大利亞國立大學 (Australian National University)的Hall教授,他是個極多產的學者。他若跟全世界的學術單位相比(依九份期刊),可排在第17名,緊跟在第16名著名的美國Carnegie-Mellon大學之後,而該校有14位統計學者。

我們可看到在兩種排名中,均各有五位中國人,其中除王永雄教授外,都來自臺灣。當然,除他們幾位之外,我們還有很多早已是一派宗師的統計學者,如李景均、周元燊及刁錦寰等諸位教授。我們要強調的是這份排名只是一個參考,一項指標,後人在計成就時所考慮的便不只是論文的量而已(雖然前述排名已是只考慮極好的期刊),我們僅是藉此排名來顯示中國人的優異表現。

名次 頁數 作者 完成博士學位年代
1 340.3 Hall, P. 1976
3 184.7 Wu, C.F.J. (吳建福) 1977
6 142.0 Li, K.C. (李克昭) 1981
13 128.6 Hwang, J.T. (黃俊宗) 1979
16 122.4 Wei, L.J. (魏立人) 1975
45 84.8 Tsay, R.S. (蔡瑞胸 ) 1982

表1. 9份期刊之一些排名

名次 頁數 作者 完成博士學位年代
1 151.6 Hall, P. 1976
2 138.7 Li, K.C. (李克昭) 1981
8 103.5 Wu, C.F.J. (吳建福) 1977
11 97.6 Hwang, J.T. (黃俊宗) 1979
29 57.4 Wong, W.H. (王永雄) 1980
36 50.4 Cheng, C.S. (鄭清水) 1977

表2. Annals of Statistics 之一些排名

這是依據西元1980至1986年的資料,各位可看出排名在上的幾位中國學者,彼時均完成博士學位未久,但便已光芒四散。至西元1997年,11年來前述幾位學者仍是獨領風騷,華山論劍時,武功之高依然令人不敢逼視。但江山代有能人,尤其自中國大陸開放後,更有大量的數學訓練極佳的優秀人才,至歐美專攻統計。可以說來自臺灣、大陸、香港及新加坡等華人聚集地區的統計學者,現今在國際統計界有許多位已是極具份量,研究頗為突出的。底下我們給一佐證。

中央研究院統計科學研究所的趙民德博士,針對國際上30份最佳的統計期刊,在西元1989至1993年的五年間所刊登的論文,依照頁數及作者數,如一篇長20頁的論文,先以19.5頁計(他假設最後一頁只刊登半頁),若只有一位作者,則該作者獲19.5點;若有二位作者,則二位各得19.5/2 =9.75點,餘類推。他依照點數高低,列出全世界20點以上的作者,計有1197位。Hall教授仍是名列第一,有623.0417點。第二名是Dynkin教授,有239點。在前60名中,華人共有11位,其中五位來自臺灣,五位來自大陸,一位來自香港(黎子良教授)。這11位中,有兩位目前在臺灣工作,其中一位是中央研究院統計科學研究所的魏慶榮博士(第52名),一位是國立中山大學應用數學系的白志東教授(第27名)。白志東教授於西元1982年在大陸獲統計博士(是大陸頒發的第一批十八位博士之一),1984年赴美研究,1994年至臺灣從事教學及研究。所以臺灣在國際統計界已至少有二位世界第一流的學者。

再給一例。統計界有一個大獎:COPSS Presidents' Award(是由幾個重要的統計學的組織所支持,COPSS之全名為The Committee of Presidents of Statistical Society),每年頒給一位在統計方面有重要貢獻的40歲以下的學者,此獎被認為相當於統計界的諾貝爾獎。自西元1981年開始頒發此獎,每年一位,至1997年共有17位得獎,其中有三位是中國人,分別是1983年的黎子良教授(來自香港),1987年的吳建福教授,1993年的王永雄教授(來自香港),十七分之三,中國人得獎佔了極大的比例。香港僅五百萬人口,卻產生了兩位,頗令人尊敬。Hall教授則是1989年的得主。黎子良教授現已為我國中央研究院院士。

這裡有一點要說明的是,如同其他行業,做研究也是要向高難度挑戰。第一步當然是發表論文,第二步是在好期刊發表,這是為何Phillips教授等人只計那九份期刊,其他期刊不計的原因之一。而把一切量化是大家均較易看得懂的。下一步要追求的是“突出的貢獻”,做些可留傳千古的作品,(有人可跳過第一步或第一步及第二步皆可跳過),這便不一定只依賴量。此正如同一部真正好的電影,並非依該電影之賣座情況而訂,而最流行的歌曲也不一定是真正好的曲子。當然“量”與“突出的貢獻”二者間的相關性是不小的。Hall教授雖在論文的量方面遙遙領先,但他得COPSS獎的年份卻較吳建福教授還晚。

華人在世界上有個組織叫泛華統計協會(International Chinese Statistical Association),這是一個非常活耀的學術團體,小活動不計,西元1990年,在香港舉辦第一屆泛華統計研討會,西元1993年在臺灣舉辦第二屆,第三屆則於西元1995年在大陸北京舉行。西元1996年,國立中山大學應用數學系更主辦第一屆海峽統計學研討會,有近三十位大陸的統計學者與會,為第一次大規模的大陸統計學者來臺。

另外,由中央研究院統計科學研究所與泛華統計協會合辦的統計期刊Statistica Sinica,創刊於西元1991年,在臺灣發行,自西元1992年起便被收錄進科學引用指標 (Science Citation Index,簡稱SCI)的 期刊引用報告 (Journal Citation Reports) 中。在統計與機率 (Statistics and Probability) 項下,西元1992年被選入的共有44份期刊,按照所謂的影響係數 ( impact factor,簡寫IF),Statistica Sinica排名在第22,超越了日本的Annals of the Institute of Statistical Mathematics(排名第24),北歐的Scandinavian Journal of Statistics(排名亦為24),加拿大的Canadian Journal of Statistics(排名第26),等先進國家統計方面的代表性期刊。因要有兩年的記錄才有可能被收錄進科學引用指標,Statistica Sinica算是以極快的速度被國際學術界所肯定。此實為中國人之一殊榮。Statistica Sinica首任主編為刁錦寰院士(一任三年),第二任主編為美國密西根大學(University of Michigan)的吳建福教授,現任主編為美國加州大學柏克萊分校 (University of California at Berkeley) 的鄭清水教授。

2、倚天不出 誰與爭鋒

中國人在統計方面的表現,在世界上固然很優異,整體而言,與我國其他學門相比又如何呢?國科會自然處曾發佈西元1995年,我國與日本、大陸及南韓論文出版之統計及比較(見自然科學簡訊 (1997),第9卷第2期,p.56-57),其中將數學及統計當做一類。表3至表5分別列出數學與統計、物理及化學之比較。

在此三表中*是我們算出後附上的。因此數字其實較所謂“以上重要期刊佔SCI論文比率”更有意義。國科會列出一些他們認為各學門的重要期刊。在數學與統計方面,於重要期刊中我國共發表19篇,除以我國之SCI論文數277,即得6.9%。比較各國發表的論文中,有多少比率是在好期刊發表,足以顯示該國論文中高品質的比率之大小。但通常在翻閱一期刊時,人們心中其實大致是依據各國人口的比率,作為比較各國在該期刊發表論文的能力誰優誰劣。而且若一國之SCI論文數較少,則“重要期刊佔SCI論文比率”便會較高,並不合理。如一國若某年只發表一篇SCI論文,表現算是不佳,但若此篇是刊登在重要期刊,則 1/1=100%,為全世界第一名。但這種第一有何意義呢?所以我們算出*的值 。

上述三表顯示我國在數學與統計的論文發表數,在考慮人口因素之下,優於日本(更遠勝大陸及南韓),而物理及化學均落後日本許多。若以發表在重要期刊所佔之比率,在考慮人口因素之下 ,在數學與統計方面,我國是日本的兩倍以上 (0.090比0.042),優勢較SCI論文數更甚。而物理及化學 也均落後日本 (分別是0.74比0.87,及0.42比0.64)。由於數學及統計的SCI論文數合計,所以無法分別比較數學及統計。但表3數學與統計中的重要期刊之後三份為統計的期刊。我國發表10篇,日本及大陸各只有一篇,韓國0篇。而數學方面,我國有9篇,日本有52篇,大陸有41篇,韓國有13篇。顯示我國在統計方面高品質的論文數(即使不考慮人口因素,而臺灣是此四地區中人口最少者),遙遙領先日本、大陸及韓國,且較物理、化學 及數學優異極多。此顯見我國在統計方面發表好論文的能力,與鄰近這些地區相比,居於極強的地位。由國科會的這份報告,可看出經多年來的努力,國內統計學的發展已逐漸開花結果了,這優異的成績相信會激起國內統計界更奮發向上。將更有信心與先進國家爭長短,更相信中國人是適合從事統計研究工作的。

我國 日本 大陸 南韓
SCI期刊收錄論文篇數
(每十萬人篇數)
277
(1.32)
1331
(1.07)
834
(0.07)
223
(0.50)
Annals Mathematics (IF: 1.257) 0 1 0 0
Mem. Am. Mathematical Soc. (0.897) 1 0 1 0
Trans. Am. Mathematical Soc. (0.521) 3 9 11 4
Proc. Am. Mathematical Soc. (0.296) 5 42 29 9
J. Royal Statistical Society B (1.864) 1 0 1 0
J. Am. Statistical Association (1.135) 4 1 0 0
Annals Statistics (0.836) 5 0 0 0
以上重要期刊佔SCI論文比率
* (每十萬人篇數)
6.9%
(0.090)
4.0%
(0 .042)
5.0%
(0.0035)
5.9%
(0.029)

表3. 數學與統計期刊論文

我國 日本 大陸 南韓
SCI期刊收錄論文篇數
(每十萬人篇數)
934
(4.45)
9863
(7.89)
3017
(0.25)
1352
(3.00)
Physical Review Letters (IF: 6.297) 27 214 16 30
Physical Review A (2.280) 16 68 58 11
Physical Review B (2.834) 58 532 188 91
Physical Review C (2.045) 9 74 45 9
Physical Review D (3.346) 32 91 46 42
Physical Review E (2.159) 14 114 55 26
以上重要期刊佔SCI論文比率
* (每十萬人篇數)
16.7%
(0.74)
11.1%
(0.87)
13.5%
(0.033)
15.5%
(0.46)

表4. 物理期刊論文

我國 日本 大陸 南韓
SCI期刊收錄論文篇數
(每十萬人篇數)
675
(3.22)
849 7
(6.80)
2748
(0.23)
963
(2.14)
J. Am. Chem. Society (IF: 5.263) 6 169 5 8
J. Organic Chemistry (3.251) 17 177 14 15
Organometallics (3.118) 25 71 4 11
J. Physical Chemistry (3.359) 23 284 27 29
Analytical Chemistry (4.509) 6 46 6 2
以上重要期刊佔SCI論文比率
* (每十萬人篇數)
13.2%
(0.42)
9.4%
(0 .64)
2.3%
(0.0053)
7.4%
(0.157)

表5. 化學期刊論文

在此SCI及IF ,為現今比較研究論文的優劣所常被引來做依據的,雖其客觀性 大有爭議,若完全相信它,只會產生極大的盲點,但卻是沒有辦法中的辦法。 而國科會所附的各學門的幾份重要期刊,當然也只是選幾份被較多數人公認 較好的,並不表示只有這幾份才有價值。

3、國人特質適合從事統計研究工作

為什麼華人在統計方面與其他領域相比,不論在學術及組織,表現會如此突出?是不是華人的特質適合從事統計研究這個行業?我們藉棒球來說明。

大家知道臺灣的棒球運動,在世界佔有一席之地,少棒、青少棒及青棒所得的世界冠軍頭銜已數不清了,成棒也長期是世界五強,還曾得過奧運銀牌。事實上在臺灣運動人口最多的倒不是棒球,籃球可能還較吸引人,尤其是學生們所熱愛的球類,但我們的籃球表現實在是夠令人傷心了。

中國人個人技巧不錯,所以諸如高爾夫球、乒乓球都還有相當的成就。但團隊合作就沒那麼好,體力也不夠好,個性又較斯文。對那種非常注重團隊合作、極耗體力或激烈的運動,如籃球、足球或網球等,表現就不是那麼好,雖然我們全國上下也極重視籃球及足球等運動。棒球極重個人技巧,是要一些合作,不過中國人還可應付,因為我們從小由國文課或公民與道德或一些勵志的書中,完全了解到合作的重要(只是常做得不夠好)。而在棒球比賽,球員的功過倒是較容易分清的,連是否為犧牲打也很容易判定,因此每位球員均能全力以赴,不分守備位置及打擊順序,人人均有機會成為明星。另外,一場球賽九局打下來,體力消耗並不太多(尤其若碰到己方有一位超級投手,則除捕手外,其他球員就很輕鬆了);而又雙方輪流打,貼身、肉搏的機會並不多。就是這種特質使我們在棒球方面能有極佳的表現。我們由少棒起家,發展到今天有兩個職棒聯盟,共有十一支職業棒球隊。二十餘年前的紅葉少棒隊擊敗來訪的日本隊,是我們發現中國人的基因適合打棒球的開端。今天我們亦逐步發現統計學的一些特性,就如同在各項運動中的棒球一樣,使它在各學門中,極適合中國人致力發展。

中國人的數學訓練不錯,根基紮實(想想我們自幼稚園起投入多少精力在數學上),但動手做的功夫就略遜些。統計學要用到相當程度的數學,但大致來說,剛好是中國人普通最熟練的部分(如微積分、線性代數等)。要動點小手,但通常只要在計算機前敲敲打打,倒不用將計算機拆開來,這也還好。統計學中的許多研究,常是一個人便可單獨完成,有時兩人,偶而三人以上,而不需太大的團隊合作,這也蠻適合中國人的,只需必要時找到一兩個人合作,並不需一大群人。學術界有些領域要花不少精力在社交活動,或門派分明,或少數大老級長期掌握資源,或要有好的包裝,在國際上這些一般而言並非中國人所擅長處理的。統計學具有數學的特色,通常理論的對或錯是很清楚的,有其公論。好的結果是大家所追求的,與研究者的出身背景及門派關係不是很大。又由於這是一門應用的學科,偶而也要與外界打打交道(因此不是那麼不食人間煙火,中國人講大隱隱於市,諸葛亮躬耕於南陽,苟全性命於亂世,不求聞達於諸候,其實卻在等待劉備三顧草廬),但因為理論結果的好壞,畢竟是統計學者所極重視的,所以還是要將極多的精力花在研究室中,偶而為了蒐集資料或印證其理論等工作,才需入世了解一下民生疾苦,這也頗符合中國人的性情。由於有以上的這些因素,中國人自然地在國際統計界有如此傑出的表現。

4、參考文獻

1. Phillips, P.C.B., Choi, I. and Schochet, P.Z.(1988). Worldwide institutional and individual rankings in statistical theory by journal publications over the period 1980-1986. Econmetric Theory 4, 1-34.