發表文章

目前顯示的是 5月, 2018的文章

PS2 — 因果本無心,天機皆可洩: 統計!

圖片
Fortuna (1754), Tadeusz Kuntze 世間多少荒唐事,何獨神仙有是哉 一、眾言落花本有意 每周接到騷擾電話的次數、補教名師表示今年指考物理科非常的簡單,可我怎麼都不會寫!我在台灣算是低收入戶嗎?股票投資會賺錢嗎?醫療險推銷員說台灣人一生花在在醫療上的經費平均超過300萬,早買賺愈多、半(扮)仙老師鐵口直斷年過40接下來會遭婦女病纏身……等等。  生活中總充滿著無盡的變數與不確定性,正是這種混沌的狀態,另我們感到迷惘,甚至很怕遭逢意外人生便從此跌入谷底萬劫不復。甚至當大家說發生的機率很低時卻發生在我身上,這是因為我太幸運還是因為業障積太多,就跟老婆子的陳年宿便一樣令人擔憂。所以在傻傻的以為有買有保庇時,其實簽的都是滿紙荒唐言,一把辛酸淚;都云買家癡,誰解其中味?~笑! 二、是偶然還是注定?統計分布 (statistical distribution) 在討論到底這件事會不會發生的問題時,問題本身看似單一,但不同時刻同個問題可能有不同的發生機率,這就是事件對時間的分布。尤有甚者,同個問題還可以劃分出不同的子事件\(A_i\),其中\(A_1\)好發於年輕族群、\(A_2\)則在壯年、\(A_3\)較易於發生在男人生上……這也是分布,而且是更複雜,含有更多維度(multi-dimensional)資訊的分布(我知道你在想什麼,但絕對不是像星際效應那種蟲洞黑洞的時空維度XD)。我們接著來看看這些看似隨機而且雜亂的事件,其中到底蘊含了什麼奧妙?又該怎麼看待發生在每個人身上的機率這件事? 1. 關於事件分布的二三事 在開始討論統計分布以前,我們先來預備一些基本知識。首先對真實世界而言,母體(沒有人在演駭客任務!)的事件數是非常大量,或者可以說趨近於無限大(\(\infty\)),基本上我們不可能有時間與人力去普查一個無限大量的事件,所以我們會對母體做採樣(sampling),採集出來的結果就稱作樣本(sample),如果採集的過程是隨機的,那麼這一組樣本資料則可視為是隨機變量(random variables)。 圖1.  房間粒子溫度採樣,非按照比例繪製  直接看圖1會比較好理解,假設一個房間內有大量的粒子,每個粒子有不同的溫度\(T_i\),我們不可能把每個粒子都抓下來量溫

PS1 — 命定的機運: 機率!

圖片
Fortuna ,  Sebald Beham  (1541) Fortune favors the bold — 拉丁諺語 一、天生帶賽? 為什麼感覺每次大樂透開獎就是有幾個幸運兒可以抱走千萬分之一的頭獎、朋友每期發票怎麼老是都會中個兩百元,seafood真的有神力嗎?人生有太多的不公平與競爭,好像別人總是過得比較好,也比較幸運,我就比較衰洨,但真的是如此嗎?是自欺欺人,還是真有其事,歡迎來到機率的世界。在這裡,我們都不過是一組數字! 二、漫談機率,雖然我什麼都沒談XD 1. 什麼是機率 (probability)? 簡單來講,假設事件\(A_1,A_2,...A_i\)所對應到的發生次數分別是\(n_1,n_2,...,n_i\),那麼全事件\(n\)則是\(N=n_1+n_2+...+n_i=\sum_{k=1}^i n_k\),那麼對特定事件\(A_j\)發生的機率\(P(A_j)\)則是$$P(A_j)=\frac{n_j}{N}$$其中\(n_j\)為事件\(A_j\)發生的次數,另外$$P(E)\equiv P(A_1+A_2+...+A_i)=\frac{\sum_{k=1}^i n_k}{N}=1$$其中\(P(E)\)為全機率,代表所有事件發生的機率,恆為1。  舉個聽到煩的例子,擲一枚硬幣100次,如果正面的次數是53次而反面的是47次,見表1,則我們說\(N=100\)且擲出正面的機率是\(P(正面)=53/100\approx0.53\)而\(P(反面)=47/100\approx0.47\)。當然還有其他的例子,例如一個地區內每次雷雨發生時被雷劈中的機率、在人行道上被不長眼的汽車撞的機率、每次不安全性行為染上HIV的機率、廟裡抽籤抽到上上籤的機率……透過對這些數字的感覺,可以在潛意識裡幫助我們做出日常生活中每一刻的決策。 表1. 擲公正硬幣100次正反出現次數與機率 面 正 反 次數 53 47 機率 53/100 47/100 2. 什麼是平均 (mean)? 平均