國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:統計下凡(四)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2021/7/4 上午 11:32:42

4 機率實作

球隊比賽,有時以投擲銅板來決定攻防先後,此因人們多半視銅板為公正。生活上,銅板除當錢幣外,也偶被用來當做公正的象徵。若接受某一銅板為公正,那便會相信,只要持續投擲該銅板,則正面數出現的相對頻率,將很可能愈來愈接近0.5。這便是著名的大數法則(law of large numbers)。實踐檢驗真理,真有人動手執行過實驗嗎?

坐牢時能做什麼?大部分的人是沒辦法在獄中完成“正氣歌”之類的傳世作品,或其他什麼偉大的成就,只能長吁短嘆吧!但其實仍有些事可以做。克里奇(John Edmund Kerrich1903-1985)出生於英國,但在南非成長,後來回到英國唸大學。自1929年起,他開始擔任數學講師。他稱不上什麼了不起的數學家,使他出名的,是因他曾執行一系列的機率實驗。19404月初,他到丹麥首都哥本哈根拜訪親戚,在預計返回英國的兩天前,49日,德國納粹入侵丹麥。戰事僅持續6小時,丹麥政府便宣告投降,所以此戰役有時被稱為六小時戰爭(Six Hour War),是第二次世界大戰期間,為時最短的戰役之一。南部與德國接壤的丹麥,對德國的戰略價值並不高,德國佔領的主要目的,是用來作為入侵與丹麥一海之隔,戰略價值極高的挪威之集結地,並確保部隊補給線之安全。至於挪威戰役(Norwegian Campaign),則從194049日起至610日止,為期超過兩個月,雖最後仍淪陷,挪威可說奮勇抵抗。

在被囚禁期間,閒閒沒事幹,克里奇遂以銅板及乒乓球,來展示幾個簡單的機率法則之有效性。克里奇將每次投擲結果均記載下來,第二次世界大戰後,他出版“機率論實驗導論”(An Experimental Introduction to the Theory of Probability),發表他的實驗紀錄。克里奇共投擲銅板1萬次,其中有5,067個正面,正面數出現的相對頻率為0.5067。此觀測能支持該銅板為公正嗎?是有點偏差,但大家想必了解,不能要求剛好得到投擲數之半5千個正面,才相信銅板為公正。事實上,若每次擲銅板實驗,皆恰得到半數個正面,一般人比較可能的反應,應是懷疑其中有貓膩,而不是就此心服銅板為公正。有點小偏差反而更易讓人相信銅板為公正,只是偏差可容忍到多大?

可求出當銅板為公正,投擲1萬次後,所得正面數之期望值為5千,標準差為50。如今正面數偏離期望值67,即偏了1.34個標準差。這樣的偏差算大嗎?一般會認為並不算太大,因利用中央極限定理(central limit theorem)來近似,偏差(超過或不足)至少1.34個標準差,其機率約為0.18,不算難發生。若就此便推翻銅板為公正,似太嚴苛了。因如此每56個實際公正的銅板,便差不多會有1個將被誤判為不公正。通常大約偏差逾1.96個標準差,才會不接受銅板為公正,即所得正面數,大於5,098個,或小於4,912個,才會拒絕銅板為公正之假設。在銅板為公正下,此機率約為0.05。統計實務上,不超過0.05的機率,通常才被認為算小的。例如,若得到5,100個正面,便會拒絕銅板為公正。

上述說明顯示,若欲以投擲來估計銅板出現正面之機率,即使投擲數高達1萬次,其估計大致也只能到小數12位準確。這是很正常的。現在來看投擲數多達1百萬次會如何?假設銅板公正,則所得正面數之期望值為50萬,標準差為500。所以得到的正面數,落在不超過期望值1.96個標準差之區間,即[499,020500,980],其機率約為0.95。此時對出現正面機率之估計值,將有約0.95的機率,介於0.49902,至0.50098間,大約到小數點後第3位準確。此顯示估計要夠準,所花的代價是投擲數要相當大。即使這樣,仍有約0.05的機率,估計值不落在前述區間。由此可看出統計與數學之別:在數學裡追求精準,機率值差0.05算是相當大。但統計裡,若誤差的機率為0.05,並不會覺得過大。尤其若數據本身就有難以掌握的誤差,如做民調時,樣本品質往往不會太高,此時追求過小的估計誤差,或誤判機率值,反會擔心造成他處更大的誤差。所謂明足以察秋毫之末,而不見輿薪,如此將得不償失。

歷史上,曾實際去多次投擲銅板的人,可能並非太多,因那畢竟是一件相當單調的事,且數學家對於實作,通常興趣不太大。近年來則有一受人關注的“投針實驗”。

數學裡有幾個既特別又重要的常數,其中圓周率π,應為人們最熟知的一個。圓周率乃圓周長與其直徑之比,而半徑是r的圓,周長則為2πr,面積為πr2,這是人們從小學起便知道的。又,以希臘字母π來代表圓周率,乃英國威爾斯(Wales)的數學家瓊斯(William Jones1675-1749)所提議的。不過歷史上,至少自阿基米德(Archimedes,西元前287-212)的時代起,便持續有人探討π了。而早在距今15百多年前,我國的祖沖之(429-500),這位南北朝時第一個朝代宋的著名數學家,約於480年,利用我國另一位重要要數學家,三國時代魏國劉徽(225-295)的割圓術,從圓的內接正6邊形開始,持續分割,至正24576(=6×212)多邊形,求出

3.1415926 < π < 3.1415927

精確到小數點後第7位。π的近似值常簡單地取為3.14,或到小數點後第5位的3.14159,或更精準的3.14159265358979等。π乃一無理數,甚至是超越數(transcendental number)即不為一整係數多項方程式之根。若以分數表示,則π22/7333/106355/11352,163/16,604103,993/33,102、及245,850,922/78,256,779等之表示,依序分母愈大愈精準。

現在便來看,什麼是布豐投針問題(Buffon’s needle problem)。布豐(Georges-Louis LeclercComte de Buffon1707-1788)18世紀一位涉獵相當廣泛的法國科學家。他曾提出一投針問題,我們將問題稍修飾如下:假設一平面上有無限條間距為l之平行線,隨機地投擲一長度為a之針至此平面上,其中a<l。求針會與其中某一條平行線相交之機率。底下略說明解法。

將平行線的某一方向稱為左,另一方向稱為右,而與平行線垂直的方向,一稱為上,一稱為下。令X表針落在平面後,與右方向之夾角,夾角落在區間[0π),又令Y表針下方端點,與最接近的上方那條平行線之距離,此距離落在區間(0l]。而所謂隨機地投擲一針至平面上,我們解讀成XY獨立,且分別在區間[0π)(0l]均勻分佈。即XY之聯合機率密度函數

f(x,y)=1/(πl)x[0,π)y(0,l]

P(針與某一平行線相交之事件)=P(Y a sinX)

上式右側機率,即f(x,y)x-y座標平面上長方形區域[0,π)×(0,l]之重積分。經簡單的計算,得

P(針與某一平行線相交之機率)=2a/(πl)

至於上式左側機率,可經由投擲針n次,若其中有kn次針與平行線相交,則以相對頻率kn/n來估計。於是當n夠大,kn/n便可用來近似2a/(πl),即π可以2an/(lkn)來近似。這便是以投針來估計π。至於這樣的估計能有多準,當然與n之大小有關。而且,如前述對以投擲來估計銅板出現正面機率之說明,若欲對π的估計夠精準,n通常須相當大才行。

上述近似過程,乍看之下有些神奇,因圓周率為一常數,如今卻能以一套隨機的程序來估計它,且這豈不就是數學與統計的結合嗎?令人振奮!其實一特定銅板出現正面的機率,也是一定值,只是未知而已,而人們也是以投擲銅板這種隨機程序來估計它。本質上此二估計,乃在執行類似的工作。

連政治人物,都感受到π的重要。2009312日,美國眾議院通過,將每年的314日訂為“圓周率日”(Pi Day)。聯合國科教文組織則於2019年通過,每年314日為國際數學日(The International Day of Mathematics)。當然這天各國應都不會放假。如何慶祝國際數學日?自2020年起,中華民國數學會於314日,舉辦“萬人布豐投針實驗”。依該學會之報導,2020年全台共有兩百多個班級參與,投擲數最多的是10,040次,測得圓周率為3.4451;投擲數最少的是224次,測得圓周率為3.0046。全部回收的數據(排除14份異常值)中,總投擲229,105次,其中相交138,955次,依布豐公式,得到圓周率之估值為3.140516…,絕對誤差約千分之一,相對誤差約萬分之3。至於2021年,除了事先邀請全台152所學校,超過萬名師生參與布豐投針實驗,也廣邀民眾,於314日當天,在國立臺灣科學教育館(簡稱科教館),一起參與現場的投針實驗。152校師生,事先之投針實驗合計後,估算出的圓周率為3.1372;科教館現場民眾參與的實驗,估算出圓周率則為3.1418

2019325日聯合報的好讀周報有則新聞,開頭便說“Google本月14日宣布,日籍女工程師艾瑪岩尾(Emma Haruka Iwao)耗時4個月,以雲端服務算出圓周率至小數點後31.4兆位數,刷新此前22.4兆位數的紀錄,以此紀念π對科學發展的重要性。”31.4兆位,就是31.4萬億位。注意這是“位數”,而1兆“僅”有13位。若以A4紙列印,假設1頁能印4千位,需要78.5億頁,才能印出這麼長的一串π值。若1本書有1千頁,將需要785萬本書,才能印出來。在2019年的圓周率日,Google公司宣佈打破紀錄,求出圓周率至小數點後31.4兆位,以為慶祝。而我們如何慶祝?大費周章,卻只能求出圓周率至小數點後12位。參與投針實驗的萬名師生,因此對機率的認識有增加嗎?能更引起學習機率的興趣嗎?恐怕皆未必。因他們每個人所做的事,不過是擲幾根不算細的“針”(由所公佈的活動照片,看起來較像竹籤),而以所得到的結果來估計π,將被略具數學概念的學生識破並不實際,因得到的估計值,準確性大多不如他們自小學起即熟知的近似值3.14,不如3.14159準確則是一定的。

一方面已知的常數圓周率,已有很多精準的數學公式來近似,要精準到小數點後第幾位都可以,只是所花時間長短的問題。而一未知的銅板出現正面之機率,不妨以p表之,既然是未知,只好以隨機投擲來估計,而即使投擲數再大,都無法保證p之估計值,能到小數點後第幾位準確。況且若以n表投擲數,數學上令n趨近至∞不過一句話,實際擲針時,不但n無法趨近至∞,連n並不算太大時,執行起來便已相當困難。另一方面,投擲銅板後,那一面朝上很容易辨識;至於擲針後,那些針與平行線相交,並非那麼容易分辨。即使平面上只有一根針,有時仍得睜大眼,才能判定該針與平行線是否相交,何況針很多時。活動照片顯示,經大量投擲後,往往多根針交錯重疊。如此計數時不產生錯誤,根本是高難度。更不要說,可能是為了更易看清楚,一條條的平行“線”,均約有0.5公分寬,針的寬度加上線的寬度,將讓計算的誤差變得更大了。

要知統計是沒有辦法中的辦法,當無其他辦法時,統計便能大顯神通。若已有簡易明確的辦法求出精確值,實不必再大費周章,以誤差不小的觀測實作來估計。當然針看起來似比銅板更莫測高深;圓周率比銅板出現正面之機率也似更有學問;畫有平行線之擲針地板,比不必佈置之擲銅板地板亦似更吸引人,這些都可能是舉辦擲針活動,而不是舉辦擲銅板活動的原因。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (909J
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2022/1/19 上午 08:28:18

2003/10/20起第 6333975 位訪客
*