本文完成了對(duì)唇動(dòng)身份識(shí)別技術(shù)幾個(gè)基本問(wèn)題的理論研究,并對(duì)整個(gè)系統(tǒng)加以實(shí)現(xiàn).作為本文研究的實(shí)驗(yàn)基礎(chǔ),我們建立了唇動(dòng)方式身份識(shí)別數(shù)據(jù)庫(kù)(HITLUDB),
該庫(kù)目前包含30個(gè)說(shuō)話人每人20個(gè)漢語(yǔ)詞的音視頻語(yǔ)料.數(shù)據(jù)庫(kù)的擴(kuò)充與完善工作仍在不斷的進(jìn)行之中.在嘴唇檢測(cè)方面,
我們對(duì)自適應(yīng)色度過(guò)濾模型進(jìn)行改進(jìn),提高了算法的魯棒性,完成了對(duì)嘴唇的精確定位.結(jié)合DCT變換與K-L變換的各自特點(diǎn),
我們提出了特征提取算法,使用較少維數(shù)的特征完成了對(duì)嘴唇區(qū)域主要信息的刻畫(huà).由于唇動(dòng)信息同時(shí)包含了生理特征與行為特征,
我們使用靜念動(dòng)念混合建模的方式,完成了對(duì)說(shuō)話人唇動(dòng)個(gè)性特點(diǎn)的精確描述.在HMM訓(xùn)練時(shí),我們提出了特征的歸一化處理方法,提高了HMM在實(shí)際應(yīng)用中的性能.
最后,我們分別對(duì)身份辨認(rèn)系統(tǒng)與身份確認(rèn)系統(tǒng)的基本理論進(jìn)行了敘述,并完成了系統(tǒng)的實(shí)踐工作.
關(guān) 鍵 詞:身份識(shí)別 唇動(dòng) 特征提取 隱馬爾可夫模型 K-L變換
標(biāo)簽:
HITLUDB
身份識(shí)別
實(shí)驗(yàn)
上傳時(shí)間:
2014-01-14
上傳用戶:wsf950131