混合模型

維基百科,自由的百科全書

在統計學中,混合模型(Mixture model)是用於表示母體中子母體的存在的機率模型,換句話說,混合模型表示了測量結果在母體中的機率分布,它是一個由數個子母體之機率分布組成的混合分布。混合模型不要求測量結果供關於各個子母體之機率分布的資訊即可計算測量結果在母體分布中的機率。

高斯混合模型(Gaussian Mixture Model)

對一維的隨機變數的高斯分佈存在以下機率密度函數

其中的標準差期望值

而當將高斯分佈推廣到維時,根據定義,若維的隨機向量服從多變數的常態分佈,則存在一個對稱半正定共變異數矩陣以及期望值向量滿足的特徵函數。若非奇異的,則此分佈可以由以下的機率密度函數描述:

為共變異數矩陣的行列式。

而高斯混合模型為單一高斯概率密度函數的延伸,用多個高斯概率密度函數(正態分布曲線)精確地量化變量分布,是將變量分布分解為若干基於高斯概率密度函數(正態分布曲線)分布的統計子模型,每個子模型可視為此混合模型的隱變量

舉一個不是那麼嚴謹的例子,若是我們手上有一個班級中所有學生某一次考試的各項科目分數分佈,並且每一科的分數都大致依照高斯分佈。則當我們要描述每個學生的總分分佈時,單高斯模型及多維的高斯模型不一定能很好的描述這個分佈,因為每一科的分布的情形都不盡相同,此時我們可以用高斯混合分佈更好的來描述這個問題。