本文完成了對唇動身份識別技術(shù)幾個基本問題的理論研究,并對整個系統(tǒng)加以實(shí)現(xiàn).作為本文研究的實(shí)驗(yàn)基礎(chǔ),我們建立了唇動方式身份識別數(shù)據(jù)庫(HITLUDB),
該庫目前包含30個說話人每人20個漢語詞的音視頻語料.數(shù)據(jù)庫的擴(kuò)充與完善工作仍在不斷的進(jìn)行之中.在嘴唇檢測方面,
我們對自適應(yīng)色度過濾模型進(jìn)行改進(jìn),提高了算法的魯棒性,完成了對嘴唇的精確定位.結(jié)合DCT變換與K-L變換的各自特點(diǎn),
我們提出了特征提取算法,使用較少維數(shù)的特征完成了對嘴唇區(qū)域主要信息的刻畫.由于唇動信息同時包含了生理特征與行為特征,
我們使用靜念動念混合建模的方式,完成了對說話人唇動個性特點(diǎn)的精確描述.在HMM訓(xùn)練時,我們提出了特征的歸一化處理方法,提高了HMM在實(shí)際應(yīng)用中的性能.
最后,我們分別對身份辨認(rèn)系統(tǒng)與身份確認(rèn)系統(tǒng)的基本理論進(jìn)行了敘述,并完成了系統(tǒng)的實(shí)踐工作.
關(guān) 鍵 詞:身份識別 唇動 特征提取 隱馬爾可夫模型 K-L變換
標(biāo)簽:
HITLUDB
身份識別
實(shí)驗(yàn)
上傳時間:
2014-01-14
上傳用戶:wsf950131