數學雜記2 - 從高斯混合EM推導K-means

為了IA9內容的完整性,我還是趕快把如何從高斯混合EM過渡到K-means的證明補齊吧,免得時間一久不但忘了也懶了😂 讓我們從置信度開始,它是這樣表示的 γ(znk)=πkN(xn|μk,σ2k)∑k′πk′N(xn|μk′,σ2k′) 用來闡明該點xn是屬於第k群的可能性,注意分母的k′是個dummy variable,並且在上式中的參數捨去了粗體寫法,讀者必須知道它們都可以直接推廣到向量的形式。所以我們便可以計算出第k群的中心位置μk: μk=1Nk∑nγ(znk)xn 和 Nk=∑nγ(znk). 由於高斯分佈完整的形式為 N(xn|μk,σ2k)=1√2πσkexp[−(xn−μk)22σ2k] 並將它代入Eq. (1)稍做整理後得到 γ(znk)=βkexp(−β2kℓ2nk)∑k′βk′exp(−β2k′ℓ2nk′), 其中標準差的倒數βk=1/σk稱做 肛 …啊不好意思,是 剛度 (stiffness) 而ℓnk即歐氏距離√(xn−μk)2,又由於πk是個常量 (zk出現的先驗機率) 和我們在意的變數都沒有直接關聯,所以我將他等式中移除並不影響。 現在我們就證明當剛度趨近無限大時,上述的高斯混合EM會變成K-mean的形式,故有...