1 數據已死?
2016年的美國總統大選,於美國時間11月8日舉行。結果揭曉後,很多媒體、民調機構,及選舉專家,個個灰頭土臉。因一路不被看好的共和黨候選人川普(Donald Trump),竟然擊敗民主黨候選人柯林頓(Hillary Clinton),當選第58屆美國總統。選舉大爆冷門,不但讓不喜歡川普的人難以接受,也讓統計遭池魚之殃。有些人就此認定真相大白,統計果然是比可惡的謊言還可惡的謊言:
There are three kinds of lies: lies, damned lies, and statistics.
這原本是十九世紀,曾兩度擔任英國首相的迪斯雷利(Benjamin Disraeli,1804-1881)所說。不過是自美國著名小說家馬克吐溫(Mark Twain,1835-1910),在1907年的自傳裡引用後,才廣為流傳。
特立獨行,望之不似人君的川普,選前不斷拋出各種歧視言論,屢引起爭議,常連同黨的人都看不下去。愈臨近投票日,愈多擔心被拖累的共和黨要角,跟川普割袍斷義。沒辦法,總要為自己的政治生命著想。選舉想獲勝,得吸收各族群的票,宜多方討好,面面俱到。從頭到尾走偏鋒,不在乎激怒人,導致眾叛親離,豈有當選可能?共和黨裡熟悉選情的專家,早早覺得選舉大勢已定,再無妙手,只能期待下次了。即使不落井下石,也多半作壁上觀。眾放棄川普的“智者”,選後不禁落寞了。墨菲(Mike Murphy,1962-),曾是共和黨多位重要政治人物的策士,投票日當晚,票尚未開完,眼看川普就要當選,共和黨即將掌權,卻無絲毫喜悅。他在其推特(Twitter)上寫著:
I’ve believed in data for 30 years in politics and data died tonight. I could not have been more wrong about this election.
什麼大數據?什麼數據會說話?從今晚起,數據死了。
統計學教授,也算是這次選舉的受害者。機會教育,選舉結束,他們通常會跟學生說明,選舉過程中所用到的統計方法,也趁機讓學生了解,統計是現代做決策之一重要工具。只是這次不再意氣風發,因得解釋,到底那裡出了大差錯,使這回的統計預測,被抨擊的體無完膚。要讓沮喪不已的學生,重拾對統計之信心,真得煞費苦心。
統計究竟可信嗎?令人好奇。