本文完成了對唇動身份識別技術幾個基本問題的理論研究,并對整個系統(tǒng)加以實現(xiàn).作為本文研究的實驗基礎,我們建立了唇動方式身份識別數(shù)據(jù)庫(HITLUDB),
該庫目前包含30個說話人每人20個漢語詞的音視頻語料.數(shù)據(jù)庫的擴充與完善工作仍在不斷的進行之中.在嘴唇檢測方面,
我們對自適應色度過濾模型進行改進,提高了算法的魯棒性,完成了對嘴唇的精確定位.結合DCT變換與K-L變換的各自特點,
我們提出了特征提取算法,使用較少維數(shù)的特征完成了對嘴唇區(qū)域主要信息的刻畫.由于唇動信息同時包含了生理特征與行為特征,
我們使用靜念動念混合建模的方式,完成了對說話人唇動個性特點的精確描述.在HMM訓練時,我們提出了特征的歸一化處理方法,提高了HMM在實際應用中的性能.
最后,我們分別對身份辨認系統(tǒng)與身份確認系統(tǒng)的基本理論進行了敘述,并完成了系統(tǒng)的實踐工作.
關 鍵 詞:身份識別 唇動 特征提取 隱馬爾可夫模型 K-L變換
標簽:
HITLUDB
身份識別
實驗
上傳時間:
2014-01-14
上傳用戶:wsf950131
多媒體5.1聲道遙控功放全套方案(原理圖+制作元件參數(shù)全套)各功能描述:
1. 當A為低電平時,AC-3燈點亮,即是AC-3的輸入方式 當A為高電平時,STEREO燈點亮,即是STEREO的輸入方式
2. 當STANDBY燈點亮時,為待機狀態(tài);此LED閃動時為MUTE狀態(tài),PT2258為靜音狀態(tài),同時STANDBY為低電平
3. 各聲道(FRONT,SUB,REAR,CENT)其微調(diào)音量調(diào)節(jié)+/-5dB;音量調(diào)節(jié)從01~80dB
4. 面板無任何按鍵,均為遙控器控制
5. 剛開機時為待機狀態(tài),開機時音量為50dB狀態(tài),各微調(diào)為0dB,
6. 按遙控器的REST鍵后,系統(tǒng)為開機時狀態(tài),
7. PT2258音量衰減共80DB,按遙控器每按一次衰減1dB,
標簽:
STEREO
AC
5.1
多媒體
上傳時間:
2017-02-21
上傳用戶:黃華強