本節課主要內容HMM三個基本問題如何求解
首先明確兩種observe有兩種,離散/連續。語音識別中使用連續狀態(MFCC特征值是連續的)。連續的比較復雜,需要用函數(GMM)擬合。離散的簡單,用矩陣描述即可。
離散/連續狀態
review三個基本問題
三個基本問題
1. Evaluation
粗暴解法:遍歷每一種可能的hidden state/observe組合,求加和求概率。
粗暴解法
優化解法Forward:類似數學歸納法。找到n和n+1之間的關系,再計算第一項。避免重復計算。
image.png
2.decoding
backward:和forward相反
image.png
區別1:在時間t,beta看到的是t+1及以后的,必須從i隱狀態出發,后面無所謂。alpha是已知0到t,求t+1
區別2:qt在alpha里是待計算概率,在beta里是條件
近似
近似:假設B和A無關,也就是0-t和t+1以后無關
3. Train
EM算法,回頭來補充