PS2 — 因果本無心,天機皆可洩: 統計!
Fortuna (1754), Tadeusz Kuntze 世間多少荒唐事,何獨神仙有是哉 一、眾言落花本有意 每周接到騷擾電話的次數、補教名師表示今年指考物理科非常的簡單,可我怎麼都不會寫!我在台灣算是低收入戶嗎?股票投資會賺錢嗎?醫療險推銷員說台灣人一生花在在醫療上的經費平均超過300萬,早買賺愈多、半(扮)仙老師鐵口直斷年過40接下來會遭婦女病纏身……等等。 生活中總充滿著無盡的變數與不確定性,正是這種混沌的狀態,另我們感到迷惘,甚至很怕遭逢意外人生便從此跌入谷底萬劫不復。甚至當大家說發生的機率很低時卻發生在我身上,這是因為我太幸運還是因為業障積太多,就跟老婆子的陳年宿便一樣令人擔憂。所以在傻傻的以為有買有保庇時,其實簽的都是滿紙荒唐言,一把辛酸淚;都云買家癡,誰解其中味?~笑! 二、是偶然還是注定?統計分布 (statistical distribution) 在討論到底這件事會不會發生的問題時,問題本身看似單一,但不同時刻同個問題可能有不同的發生機率,這就是事件對時間的分布。尤有甚者,同個問題還可以劃分出不同的子事件\(A_i\),其中\(A_1\)好發於年輕族群、\(A_2\)則在壯年、\(A_3\)較易於發生在男人生上……這也是分布,而且是更複雜,含有更多維度(multi-dimensional)資訊的分布(我知道你在想什麼,但絕對不是像星際效應那種蟲洞黑洞的時空維度XD)。我們接著來看看這些看似隨機而且雜亂的事件,其中到底蘊含了什麼奧妙?又該怎麼看待發生在每個人身上的機率這件事? 1. 關於事件分布的二三事 在開始討論統計分布以前,我們先來預備一些基本知識。首先對真實世界而言,母體(沒有人在演駭客任務!)的事件數是非常大量,或者可以說趨近於無限大(\(\infty\)),基本上我們不可能有時間與人力去普查一個無限大量的事件,所以我們會對母體做採樣(sampling),採集出來的結果就稱作樣本(sample),如果採集的過程是隨機的,那麼這一組樣本資料則可視為是隨機變量(random variables)。 圖1. 房間粒子溫度採樣,非按照比例繪製 直接看圖1會比較好理解,假設一個房間內有大量的粒子,每個粒子有不同的溫度\(T_i\),我們不可能把每個粒子都抓下來量溫