國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:統計下凡(三十八)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2022/2/27 下午 03:24:27

38 資料探勘()

有人認為統計與考古之工作乃類似,都是在挖掘。考古上窮碧落下黃泉,挖掘出各種遺物及遺跡,統計則從浩瀚的資料中,挖掘出有用的資訊。近年來由統計學衍生出資料探勘(亦稱資料採礦,data mining)這領域,這是從挖掘的角度來看統計,如此讓統計學更具有考古學的味道。至於考古學,也有人認為,其工作並不僅是在四處挖掘,大部分的時候,其實是在做資料分析,以重建古代人類的歷史與文化,如此看來,考古學也頗有統計學的味道了。事實上,除了挖掘及資料分析外,統計學與考古學還有一特質相同。

1931年,“殷墟”(商朝後期王都遺址,位於今日河南省安陽,以殷都區小屯村為中心)4次挖掘時,才剛加入中央研究院歷史語言研究所(1928年於廣州成立,簡稱史語所,首任所長為傅斯年(1896-1950))考古組(組長為李濟(1896-1979))的郭寶鈞(1893-1971)便曾說,“事實至於遺存,推論敬俟卓識”(即只報導事實,其含意則有待高明)。因考古這門學問,有物而無言,幾千年前的歷史,由所掘出的古物,如何告訴世人,有關此物之來龍去脈?這可非挖掘出來即可得知,要有專家來分析解讀。要知挖掘固然困難,但更難的是推論。統計不也一樣嗎?數據取得不易,而一旦蒐集到,數據並不會說話,是人在說話。對所得的數據,儘可能給出能被接受的推論,才是統計之目的。附帶一提,殷墟挖掘由李濟領導,是中國歷史上首次重大的挖掘,不但對中國考古學往後的發展影響深遠,亦屬“20世紀最偉大的挖掘之一”。

推論並不容易,如舉世聞名,1986年,在四川省廣漢出土的三星堆遺址,兩個內有許多珍寶的器物坑,究竟是屬於陪葬坑或祭祀坑,至今仍無定論。甚至因蜀地無象,而遺址中卻出土象牙及象骨,因而其來源及用途,也一直爭論不休。那已被接受的推論,會被推翻嗎?也是會的。“霸陵”是漢文帝(西元前203-157年,西元前180-157年在位)的陵寢,之前大部分的學者認為,霸陵位於今日陝西西安東郊白鹿原的東北角,一個當地人稱為“鳳凰嘴”之處。鳳凰嘴附近有許多碑石,立碑者包括清朝皇帝康熙(1654-17221661-1722在位)及雍正(1678-17351722-1735在位)兩位皇帝。遙想“文景之治”,讓人發思古之幽情,畢竟漢文帝在歷史上的名聲不錯。可惜這幽情,可能從元朝起,便發錯對象了。20211214日,大陸國家文物局宣布,經過考古確認,位於鳳凰嘴之南約2.1公里(仍屬白鹿原)的“江村大墓”,才是真正的漢文帝霸陵所在地。考古之判斷,如同統計之推論,是可能有誤的。

底下給一考古裡的資料分析之例。王懿榮(1845-1900)是清朝翰林,曾任國子監祭酒(相當於皇家大學校長)。他相當博學、酷愛金石,且喜歡收藏古董。居官不過偶然之事,他一生最大的貢獻,乃是發現甲骨文,被推崇為“甲骨文之父”。由於本身略通醫術,他向來會查看家人從藥店抓回來的藥材,以了解自己究竟吃些什麼?1899年,在一味稱作“龍骨”的殘片上,他看出上面刻有一些符號。從事金石文字研究多年,王懿榮知道其中必有名堂。派人到藥店打聽後,他得知“龍骨”來自河南。於仔細端詳店裡的龍骨碎片後,他驚喜地發現,上面刻的符號,很像遠古的象形文字。他能辨識出若干,且看出有些是商朝帝王的名字。他判斷那批龍骨是商朝占卜用的,古人將文字刻寫於龜甲或獸骨上,巫師觀察透過燒灼後的裂紋,來占卜凶吉。王懿榮發現藥店裡龍骨上的符號,是比“鐘鼎文”更古老的文字。由於是刻在龜甲或獸骨,因而此種古文字,後來被稱為“甲骨文”。

如同菜單上的虎掌那道菜,食材中並非真的有老虎之手掌,何況也沒那麼多老虎可供食用,而是取豬蹄筋或膝韌帶部位,龍骨也非真的是古代龍之骸骨的化石,而就是大型哺乳動物的化石。但怎會其中也有龜甲?古時大型獸骨及龜甲,均適合在上刻字,以做為占卜用。而龜與龍都屬四靈(即麟、鳳、龍、龜),龜又極長壽,所謂千年烏龜,於是不但幾千年後,由地底挖掘出來的獸骨化石,連同混在其中的龜甲化石,都被藥商拿去當藥材,一律名之為“龍骨”。至於“鐘鼎文”又是什麼?鐘鼎文亦稱為金文,乃古代鑄刻於青銅器上的文字,始創於商朝中期,但盛行於西周。主要記載當時王公貴族的重要活動,因其鑄刻於金屬容器上,故稱為金文(亦稱銘文)。商、周二朝盛行青銅器,而青銅禮器以“鼎”為代表,樂器則以“鐘”為代表,於是金文又名“鐘鼎文”。

自發現“龍骨”裡有玄機後,王懿榮即透過各種管道,廣泛收集刻有字的“龍骨”。只是發現後的隔年(1990),王懿榮在八國聯軍攻入北京時殉國,因此他並未能對甲骨上的古文字,有太多探討,之後他所收藏的那1千多片甲骨,落到劉鶚(1857-1909)手上。劉鶚字鐵雲,他即著名的“老殘遊記”一書之作者。他收藏甲骨始於1901年,共擁有5千餘片。他將所有有字甲骨,一片一片拓下來,並從中精選出1,058片。1903年,史上第一部(6)有關甲骨文的著作“鐵雲藏龜”刊印出版。在書中,劉鶚說甲骨文是“殷人刀筆文字”,這是第一份明確指出甲骨文的使用時代為商朝之文獻。王懿榮應也有此認知,但口說無憑,學術上對於創見提出的先後,一般乃依著作發表的早晚。劉鶚對甲骨文,其實也沒有深入的研究,且他書上對甲骨文的分類,亦不是很有系統。不過如果說王懿榮是首位理解到甲骨文之學術價值者,則引發更多人參與甲骨文研究的興趣,便應是“鐵雲藏龜”之出版了。1909年,劉鶚病逝於新疆後,他所收藏的甲骨,也就流落四方了。

1904年,語言學家孫詒讓(1848-1908),依據“鐵雲藏龜”完成“契文舉例”。這是第一部考釋甲骨文的著作,全書約考釋334個字,後來被判定正確的約有185個。書稿完成後,孫詒讓請人抄寫幾份複本,分別送給劉鶚等人。但直至1917年,他過世都已9年了,此書才付梓出版。因而孫詒讓對甲骨文的研究,雖屬開山鼻祖,在他生前卻未受到該有的重視。要知學術上,不能只是敝帚自珍,而是得盡力讓著作及時公開發表,以增加影響力。與後人相比,上述3位學者,在甲骨學的研究,成果並不多,但仍是甲骨學篳路藍縷的開創者。1910年,羅振玉(1866-1940)在發表的“殷商貞卜文字考”中,首度判定甲骨之出土地,乃在“殷墟”。他對照司馬遷(西元前145-西元前1世紀初)“史記”中的“殷本紀”,肯定甲骨乃商朝晚期王室占卜記事用。之後經由考古挖掘,及其他途徑出土的甲骨,估計共約有10萬片。從這些甲骨中,已確認有5千多個相異字,其中約能辨識17百多個。西周以來,普遍使用青銅金文。據統計,鐘鼎文共約有3千字,約可辨識18百多個,比甲骨文略多些。

王國維(1877-1927),這位“人間詞話”(1910)的作者,有“新學術的開拓者”之稱。大學者陳寅恪(1890-1969)認為其學術成就“幾若無涯岸之可望、轍跡之可尋”。王國維曾以他對甲骨文的研究,來佐證“殷本紀”中,對於商朝的記載,並更正若干錯誤。從以上有關甲骨文之辨識,印證之前所說,考古不僅是挖掘出來便大功告成。一旦挖掘後,便將進行資料分析,並給出推論。但所給的推論是否就為真相呢?並不必然。也許日後新的考古,會給出新的推論,就如前述漢文帝陵寢之新發現。想探索真相,所給推論卻不見得便是真相,這點考古與統計是一樣的。在統計裡,一切都是假設,就看接受那一個。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (085P
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2022/6/30 下午 05:11:42

2003/10/20起第 6872869 位訪客
*