心在南方

發表者:黃文璋 主題: 認識機率-4解釋機率 Email:huangwj@nuk.edu.tw 日期:2009/8/12 下午 04:13:01

    在第2節我們以機率空間的方式引進機率。由於樣本空間可以是虛擬的,此時事件也就是虛擬的。
但假設真的有一項觀測,如投擲一個4面體,4面分別標示點數1,2,3,4,並觀測所得點數。則樣本空
間為1,2,3,4之集合。事件的集合可以取那一個最大的,也就是包含樣本空間之所有子集合所構成的
集合。你如果學過排列組合,便知此最大的事件集合中,共有16(2的4次方)個元素。至於機率函數,假
設點數1,2,3,4出現的機率,分別為0.1、0.2、0.3,及0.4,相加為1。至於任一事件的機率,就看
該事件包含1,2,3,4中那幾個數,再把對應的機率相加便是。如一事件中恰包含2,4,則該事件的機
率為0.2+0.4=0.6。餘此類推。這就建立了一機率空間。對同一樣本空間,可定義出很多不同的機率空
間。

    就算你已接受了機率空間的概念,反正數學家就是常給一些自得其樂的定義,仍可能會好奇,所謂
點數1出現的機率0.1,究竟是什麼意思?是每投10次,點數1恰出現1次嗎?非也!有個修過機率論的數
學系畢業生,好心地對你解釋如下:

            假設投擲n次,點數1出現a次,則相對頻率a/n與0.1之差的絕對值,會大
        於一給定的正數(不管它多小)之機率,將隨著n的趨近至無限大,而趨近至0。

務實的你,很可能不覺得這樣的解釋很實際。先提出疑問“什麼是趨近至無限大?”就是一直投擲,不
可停止,日出日落,春去秋來,繼續投擲,即使夸父追日成功了,無限大也仍未達到,還得投擲。那位
數學系畢業生,一聽到你問起無限大,如魚得水,這是他在數學系四年寒窗,學到的幾招獨門絕活之一
。你不得不停止無限大這個話題,因連夸父追日,你也覺得豈有成功時?如何能接受解釋機率,還得涉
及無限大?但還一點你不吐不快的是“我就是不了解機率值的意義,怎麼卻用機率的概念來解釋給我聽
?”

    想解釋機率值的意義,將會在機率及無限大,一層又一層的打轉。這有如想去定義什麼叫做點,最
後將如同陷在線團中,學步維艱。最後只好說,點是無定義名詞。但無論如何,你應可理解,對前述4
面體,僅投擲1次,是無法顯示點數1出現機率0.1,那個0.1的意思。機率並非只看“少數幾次”的結果
。機率是在大樣本(n很大)下,威力才顯現。機率值的意義,既然不能以一套可接受的邏輯來說明。那
麼退而求其次,可否讓人略微了解機率值的意思?或者說(除非是虛擬,只是在求一些機率值),你拿一
4面體,且宣稱點數1出現的機率為 0.1,怎麼樣才知道你講的是真的,而非信口開河,或者說記錯。

    之前那位數學系畢業生的解釋,這時便能派上用場。此即大數法則(Law of large numbers)之一簡
單的版本。數學上的意思為,事件出現的相對頻率,會“機率收斂”至事件發生的機率。要知隨機世界
中,仍有些法則要遵循,大數法則是其中很重要的一個。當然我們已指出了,實際上並無法觀測事件無
限多次。那是否可說,事件出現的相對頻率,當觀測數夠大,須接近事件發生的機率?也非如此。事件
只要機率為正,便都可能發生。所以,不論觀測數再大,都不能排除很偏頗(如觀測1,000,000次,點數
1出現的次數為0,或1,000,000次)的事件發生。但是,這時統計學家跳出來了,可以做一檢定,檢定點
數1出現的機率是否真為0.1,這是屬於統計學裡假設檢定(testing hypothesis)的範疇。簡單講,是以
在某一假設下,會觀測到這樣的結果,是否算不尋常?所謂不尋常,是指發生的機率很小,小於某一預
設的值。若屬於不尋常,則當初的假設就不宜接受。附帶一提,當假設一銅板為公正,則投擲100次,
出現至少80次正面,較投擲10次,出現至少8次正面,前者是更不尋常的,因它發生的機率,遠比後者
小。所以,在同樣獲得八成以上的正面數下,投擲數愈大,將會使我們更相信此銅板非公正,而接受它
出現正面的機率,至少是0.8。這說明在統計裡,樣本數愈大,將使我們的推論愈精準。假設檢定進一
步的討論,可參考黃文璋(2005b)一文。

    在隨機世界,究竟何者為真,常屬未知。我們往往無法“證明”那件事是真實的。不過是一個個的
假設,端看你接受那一假設。4面體點數1出現的機率,是否真為0.1,即使投擲再多次,都無法證明其
真偽。只能說數據顯示“可以接受”,或“無法接受”機率為0.1。這裡面有一套機制,以決定接受或
不接受。

    另外,對一4面體,也可估計點數1出現的機率,有一些不同的估計法,可以得到不同的估計量。在
數學中,使用不同的方法,須導致相同的結果。所謂殊途同歸。但統計裡,除非做些限制,否則常無定
於一尊的方法。對不可測的未來,我們常要做估計,統計在這方面,能扮演很好的假設。可參考黃文璋
(2007)一文。諸如銅板出現正面的機率,及病人的存活率等,皆能估計。但有時覺得以一個值估計,雖
然明確,但估計值很難恰好等於真實值,一翻兩瞪眼,常估計不準。下節信賴區間的概念,因而產生。


回應此篇文章    回本區首頁