教育行業(yè)A股IPO第一股(股票代碼 003032)

全國(guó)咨詢/投訴熱線:400-618-4000

解決哪類問題需要使用HMM模型?HMM模型是什么?

更新時(shí)間:2023年08月29日18時(shí)43分 來源:傳智教育 瀏覽次數(shù):

什么樣的問題解決可以用HMM模型。使用HMM模型時(shí)我們的問題一般有這兩個(gè)特征:

1)我們的問題是基于序列的,比如時(shí)間序列,或者狀態(tài)序列。

2)我們的問題中有兩類數(shù)據(jù),

一類序列數(shù)據(jù)是可以觀測(cè)到的,即觀測(cè)序列,而另一類數(shù)據(jù)是不能觀察到的,即隱藏狀態(tài)序列,簡(jiǎn)稱狀態(tài)序列。

有了這兩個(gè)特征,那么這個(gè)問題一般可以用HMM模型來嘗試解決。這樣的問題在實(shí)際生活中是很多的。

比如:我現(xiàn)在給大家寫課件,我在鍵盤上敲出來的一系列字符就是觀測(cè)序列,而我實(shí)際想寫的一段話就是隱藏狀態(tài)。

序列,輸入法的任務(wù)就是從敲入的一系列字符盡可能的猜測(cè)我要寫的一段話,并把最可能的詞語放在最前面讓我選擇,這就可以看做一個(gè)HMM模型了。

再舉一個(gè),假如我上課講課,我發(fā)出的一串連續(xù)的聲音就是觀測(cè)序列,而我實(shí)際要表達(dá)的一段話就是隱藏狀態(tài)序列,你大腦的任務(wù),就是從這里串連續(xù)的聲音中判斷出我最可能要表達(dá)的話的內(nèi)容。

從這些例子中,我們可以發(fā)現(xiàn),HMM模型可以無處不在。但是上面的描述還不精確,下面我們用精確的數(shù)學(xué)符號(hào)來表述我們的HMM模型。

對(duì)于HMM模型,首先我們假設(shè)Q是所有可能的隱藏狀態(tài)的集合,V是所有可能的觀測(cè)狀態(tài)的集合,即:
1693304817462_hmm.png

其中,N是可能的隱藏狀態(tài)數(shù),M是所有的可能的觀察狀態(tài)數(shù)。對(duì)于一個(gè)長(zhǎng)度為T的序列,i是對(duì)應(yīng)的狀態(tài)序列, O是對(duì)應(yīng)的觀察序列,即:

1693304870841_hmm1.png

HMM模型做了兩個(gè)很重要的假設(shè)如下:

1) 齊次馬爾科夫鏈假設(shè)。

即任意時(shí)刻的隱藏狀態(tài)只依賴于它前?個(gè)隱藏狀態(tài)。

當(dāng)然這樣假設(shè)有點(diǎn)極端,因?yàn)楹芏鄷r(shí)候我們的某?個(gè)隱藏狀態(tài)不僅僅只依賴于前?個(gè)隱藏狀態(tài),可能是前兩個(gè)或者是前三個(gè)。

但是這樣假設(shè)的好處就是模型簡(jiǎn)單,便于求解。

但是這樣假設(shè)的好處就是模型簡(jiǎn)單,便于求解。如果在時(shí)刻t的隱藏狀態(tài)是i = q ,在時(shí)刻t + 1的隱藏狀態(tài)是i = q , 則從時(shí)刻t到時(shí)刻t+1的HMM狀態(tài)轉(zhuǎn)移概率。

1693305219911_hmm3.png
2) 觀測(cè)獨(dú)立性假設(shè)。即任意時(shí)刻的觀察狀態(tài)只僅僅依賴于當(dāng)前時(shí)刻的隱藏狀態(tài),這也是一個(gè)為了簡(jiǎn)化模型的假設(shè)。如果在時(shí)刻t的隱藏狀態(tài)是i = q , 應(yīng)對(duì)應(yīng)的觀察狀態(tài)為o = v , 則該時(shí)刻觀察狀態(tài)v 在隱藏狀態(tài)q 下生成的概率為b (k),滿足:
1693305563650_hmm4.png

一個(gè)HMM模型,可以由隱藏狀態(tài)初始概率分布Π , 狀態(tài)轉(zhuǎn)移概率矩陣A和觀測(cè)狀態(tài)概率矩陣B決定。 Π ,A決定狀態(tài)序列,B決定觀測(cè)序列。因此,HMM模型可以由?個(gè)三元組λ 表示如下: λ = (A, B, Π) = (狀態(tài)序列,觀測(cè)序列,初始狀態(tài)概率分布)

0 分享到:
和我們?cè)诰€交談!