國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:統計下凡(十七)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2021/10/3 下午 01:05:17

17 蓋洛普的總統民調

1935年,年方35,哥倫比亞大學(Columbia University)新聞學教授蓋洛普(George Horace Gallup1901-1984),創立蓋洛普(Gallup)公司。他利用統計學,以抽樣調查的方法,以進行民調,是美國科學民調的先驅。蓋洛普公司成立的隔年,1936年,就憑僅訪問5萬位選民,即正確預測當年的總統選舉,羅斯福將擊敗蘭登,連任成功。初試啼聲便一鳴驚人,自此聲名大噪。美國從19362012年,歷經20次總統選舉,蓋洛普公司只有3次普選得票高低及當選者之預測均錯誤,分別是19481976,及2012年。另外,2000年之得票高低預測錯誤,但誰當選則預測正確。由於“勝者全得”選舉制度,美國總統選舉,候選人即使輸了全國普選票(popular vote),仍有可能選上總統,歷來已有幾個例子。當選者正確預測17次,85%的成功率,算是不錯的。比較一下,若是瞎猜(表每次猜對誰當選之機率為1/2),則20次能至少對17次的機率為

(C(20,17) + C(20,18) + C(20,19) + C(20,20)) / 220

= 1,351/220 1.288×10-3

不到千分之1.3的機率,顯示蓋洛普能在20次當選者之預測中,正確17次,是有些真功夫的。另外,得票率高低正確預測率則為80%,也仍不壞。但由此可看出,美國總統選舉預測的不易。要知當兩黨候選人勢均力敵,一點風吹草動,便可能使豬羊變色。我們說過,民調就是有其侷限,所以預測不準,有時乃非戰之罪。百分之百正確的預測,反而可疑。底下分別來看蓋洛普對當選者預測錯誤之3次總統選舉。

1976年,民主黨的卡特(James Earl Carter, Jr.1924-)挑戰在位的共和黨福特(Gerald Rudolph Ford, Jr.1913-2006)。蓋洛普預測普選得票率,福特會以49.0%48.0%獲勝。結果卡特以50.1%48.0%打敗福特。這是一場差距很小的選舉,預測有誤不好太苛責。

2012年,蓋洛普預測共和黨的羅姆尼(Willard Mitt Romney1947-),會以50.0%49.0%,險勝尋求連任民主黨的歐巴馬(Barack Obama1961-)。但實際結果是歐巴馬以51.1%47.2%順利過關。這次蓋洛普對得票率預測的誤差,比很多民調公司大。樹大招風,選後被有些專家,狠狠批評了一番。蓋洛普雖反駁其預測仍在統計誤差範圍內,但仍花了約6個月的時間自我檢討。之後,蓋洛普承認它的調查方法的確存在若干缺陷,包括在美國本土的東部與西部,撥打電訪的電話數都偏低、高估了白人的投票率、太依賴家用電話,使樣本裡年長者的比例偏高,以及在歐巴馬於“搖擺州”(Swing state)全力動員下,這些州的投票率顯著上升,而蓋洛普藉7個問題以判定選民是否會去投票,卻未能及時捕捉到這種變化。也就是之所以預測誤差過大,主要是對選民結構及投票行為之判斷有誤,加上取樣偏差。經此檢討,蓋洛普公司壯士斷腕,決定自2016年起,不再對美國總統選舉進行預測,而致力於其他議題的民調。附帶一提,跟台灣各縣市類似,美國有些州長期支持民主黨,或共和黨,難以撼動。有些州則視候選人而可能變天,這些州便是所謂搖擺州。

19762012年那兩次的預測不準,尚情有可原,因當雙方差距不大,估計便很容易失手。但1948年是怎麼回事?事實上,那次選舉,在競選過程中,現任總統民主黨的杜魯門(Harry S. Truman1884-1972)一直不被看好。當時幾家主要的民調公司,包含蓋洛普在內,均預測挑戰者共和黨的杜威(Thomas Edmund Dewey1902-1971),普選得票率將贏杜魯門5%以上。蓋洛普則預測杜威將以49.5%44.5%獲勝(相加不到100%,乃因另有其他兩位候選人)。結果是差不多反過來,杜魯門以49.55%45.07%獲勝。選舉人票杜魯門得303張,杜威得189張,另一候選人得39張,合計531張。由於選前杜魯門極度被看衰,媒體對他遂百般奚落。有家報紙還曾以“DEWEY AS GOOD AS ELECTED, STATISTICS CONVINCE ROPER(統計說服羅波相信杜威已當選)為新聞標題。羅波(Elmo Burns Roper, Jr.1900-1971)是當時一位以預測精準著稱的民調專家。他預測杜威將以52.2%37.1%,高達15.1%之差距,擊潰杜魯門。事後看,當然覺得此預測錯得相當離譜,還拉統計背書,統計只能啞巴吃黃蓮。投票當天一大早,有家報紙已迫不及待地刊登一篇標題為“Harry S. Truman: A Study of a Failure”的文章。而投票還未截止時,有家信心滿滿的報社,已將隔天的頭版印好了,標題是“DEWEY DEFEATS TRUMAN”。對現任總統如此羞辱,不知杜魯門有沒有懷恨在心,但至少沒聽說選後有那些媒體,遭當選的杜魯門控告散佈假消息。

1948年美國那些民意調查機構,究竟為何犯下大錯?難道犯錯是因相信統計嗎?這未免令統計工作者難堪。原來當時從事民調,大都採“配額抽樣”(Quota Sampling,亦稱定額抽樣)。即欲進行調查,先將母體分類(),確定各類()的樣本數,在決定的配額數內,再經隨機抽樣,以產生樣本。舉一簡單的例子來看。某大學的大學部宿舍住宿生中,男生佔60%,女生佔40%1234年級學生分別佔40%、30%20%10%。今擬了解住宿生對餐廳之意見,依上述二類別,以定額抽樣方式抽取500個樣本,則男生樣本數為300,其中1234年級分別有120906030人;女生樣本數為200人,其中1234年級分別有80604020人。

“配額抽樣”的原意,是想讓抽出的樣本,有如母體之一縮影,這本是一合理的想法。但在1948年的總統選舉,顯然是一失敗的經驗。怎麼會這樣?以蓋洛普為例,那時他們的民調採面訪方式。例如,一位在聖路易斯(St. Louis)城的訪員,要負責訪問13位選民,其中須包含:

(i) 6位住郊區,7位住城裡;

(ii) 7位男性,6位女性;

7位男性中(對女性也有類似要求)

(iii) 3位在40歲以下,4位超過40歲;

(iv) 1位黑人,6位白人。

6位白人每月房租要滿足:

(v) 1位超過44元,3位超過18元未超過44元,2位不超過18元。

在這麼多限制下,豈能再要求訪問之樣本須以隨機的方式產生?於是訪問名單,只要求各類配額皆達到即可,其餘便授權訪員自行決定了。蓋洛普希望樣本結構能忠實反映全部投票者的結構,所以才會顧慮各個主要會影響投票行為之特性。但其中卻有一罩門:無法對共和黨黨員及民主黨黨員給出配額。

要知在美國,只要在選前登記黨籍即可,初選時想投那一黨就登記那一黨,每次選舉可以不同。而一旦登記那一黨,就表支持該黨的候選人。只是政黨黨員比例,正是民調公司所不知道,而企圖藉由民調來獲知。精密給出各特性之配額,乃是想經調查後,能讓全國選民政治傾向的比例浮現。影響投票的因素其實很多,遠超過民調公司所能掌握的。由於訪問誰,本質上乃讓訪員自由挑選,但人的選擇,就是很難避免偏差。試想如果有學生的工讀,是在街頭發問卷,他難道不會傾向找看起來較順眼的人嗎?那些滿臉橫肉、殺氣騰騰者,任誰都避之惟恐不及,豈會趨前奉上問卷?另外,在調查時間壓力下,若遇一家人都願意填寫,難免會有訪員,不甩同質性過高的問題,在該戶多奉上幾份問卷。在1948年,多數訪員挑出的面訪樣本裡,便有過多的共和黨黨員。一般而言,共和黨黨員較富有,且教育程度較高,因而電話擁有率亦較高(注意那是1948),又有較高比例的人,有固定的地址且住在較好的區域,導致較容易被訪問到。在此情況下,大部分的訪員,都可能在有意無意下,訪問了過高比例的共和黨黨員。

事實上從19361944年的總統選舉,蓋洛普對得票率之預測,都高估共和黨候選人,而低估民主黨候選人。也就是訪員有訪問過高比例共和黨黨員的傾向。只是在那段時期,民主黨推出的總統候選人,均為現任總統羅斯福,其實力遠高出共和黨的對手一大截。因此樣本中,共和黨黨員過多,所造成的偏差,尚能被掩蓋過去,因而使蓋洛普的預測誰當選依然正確。但在1948年,兩位候選人之支持度算是旗鼓相當,因此樣本的偏差,便影響到預測結果。

有了1948年的失敗經驗後,自此美國差不多所有的民調機構,皆以機率抽樣的方式產生樣本。只是美國幅員廣大,人口眾多(20219月,美國人口估計已超過3.3258),採簡單隨機抽樣,難度極高。不要說不易拿到選民的底冊,就算有,抽出的選民分散在全美各地,從峽谷到高山,要進行訪問,不但困難且極耗成本。“叢聚抽樣”(cluster sampling,又稱部落抽樣,即將母體分成幾個群集(部落),再從幾個群集中,抽出數個群集進行抽樣或普查。適用於各群集間的變異小,而群集內的變異大。當母體底冊之蒐集及編造相當困難,或想節省調查成本時,可採用此種抽樣)遂為一常採取的作法。

直到1980年代中期,蓋洛普對總統選舉的民調,都採面訪方式,但逐漸困難起來。一方面成本愈來愈高;一方面在世風日下,基於治安的考量,民眾愈來愈不情願讓訪員進到屋裡去。但最主要還是面訪極耗時間及成本,當進入資訊在比誰能更快速取得的時代,面訪便完全不再具有優勢了。幸好電話日益普及,一般家庭都至少擁有一部電話。於是到了1980年代末期,蓋洛普的全國性民調,主要都採用電話訪問了。之後手機時代來臨,自2008年起,蓋洛普的民調方式,除電話外,已納入手機了。隨著通訊方式的多元,民調管道也將愈來愈多樣。又為了顧及老派人士,以手填寫的問卷,也仍然存在。

總之,民調要具參考價值,便得對母體結構更深入了解、樣本須更有代表性,且訪員的訓練要更紮實。而最不能忽視的一點是,對問卷的設計要更下功夫。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (0PFS
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2021/12/8 下午 05:20:44

2003/10/20起第 6226901 位訪客
*