本文完成了對唇動身份識別技術幾個基本問題的理論研究,并對整個系統加以實現.作為本文研究的實驗基礎,我們建立了唇動方式身份識別數據庫(HITLUDB),
該庫目前包含30個說話人每人20個漢語詞的音視頻語料.數據庫的擴充與完善工作仍在不斷的進行之中.在嘴唇檢測方面,
我們對自適應色度過濾模型進行改進,提高了算法的魯棒性,完成了對嘴唇的精確定位.結合DCT變換與K-L變換的各自特點,
我們提出了特征提取算法,使用較少維數的特征完成了對嘴唇區域主要信息的刻畫.由于唇動信息同時包含了生理特征與行為特征,
我們使用靜念動念混合建模的方式,完成了對說話人唇動個性特點的精確描述.在HMM訓練時,我們提出了特征的歸一化處理方法,提高了HMM在實際應用中的性能.
最后,我們分別對身份辨認系統與身份確認系統的基本理論進行了敘述,并完成了系統的實踐工作.
關 鍵 詞:身份識別 唇動 特征提取 隱馬爾可夫模型 K-L變換
標簽:
HITLUDB
身份識別
實驗
上傳時間:
2014-01-14
上傳用戶:wsf950131