發表文章

目前顯示的是 8月, 2018的文章

PS6 - 公正不公正? 不確定性的度量: 貝氏推論 (上)

圖片
PASIEKA / SCIENCE PHOTO LIBRARY Data analysis is simply a dialogue with the data —S. F. Gull 一、機率到底告訴我們了什麼? 假定我們有兩枚六面骰A和B每面為標記為1~6的整數,我們如何確定兩枚骰子都是公正的? 即每個面骰出的機率皆為1/6。古典機率的概念告訴我們若擲兩枚骰子多次,並記錄每面出現的次數,如果一枚骰子是公正的,那麼理論上每面出現的次數相同或接近相同。 圖1.  骰A (粉藍) 與骰B (粉紅) 各擲50次每面出現的次數  現在我擲50次並記錄兩枚骰子每個面出現的次數,並用將其畫成直方圖如圖1所示,從記錄的結果來看,我可以斷定哪個骰子是公正的嗎? 看起來好像不行,那如果我改成擲100次、1000次就可以分別公不公正了嗎? 換個方向來看,也許我們不在乎骰子是否公正,我們在乎的是用我們觀測的資料集\(D\),它是否可以告訴我們骰子每面出現的機率分佈是什麼? 都是同一組資料,一個是基於古典推論 (classical inference),另一個則是貝氏推論 (Bayesian inference)。對於古典推論,即頻率論而言,我們有以下原則 (tenets): 機率對應到的是事件出現的頻率,它們是真實世界的 客觀呈現 (objective properties) 參數是固定的 (未測量前是未知的),比如六面骰每面擲出的機率可以是這裡提到的參數。這裡的參數對應的是柏拉圖世界的量,如果是一枚六面公正骰,那麼每面擲出的機率一定是1/6,不可能有波動 (fluctuation) 當我們重複步驟愈多次 (如擲骰的次數),那麼每面出現的頻率應該是一個可以被定義的量 (即收斂,如果該量會產生波動則不收斂) 但對於貝氏推論而言,它則是基於如下的態度 (stance): 機率是對 主觀信念 (subjective beliefs, prior ) 的描述,而不受限於資料出現的頻率長遠來看是否是一個定值 我們對於模型參數 (例如每個面出現的機率) 的推論給出的是它位於“某個值”的機率分佈,這個分佈代表的是我們對這個參數有多清楚 (不清楚的話該參數就會是一個很大的範圍) 關於古典推論的原則是沒有問題的,非黑即白,但對於貝氏推論的部