?? 說明.txt
字號:
用matlab仿真0到9十個數字的語音識別
1、對語音的WAV文件和LAB文件進行處理,產生十個文件,每個文件對應于一個數字,存貯著該數字的波形文件。(shujuzhengli.m)
2、分別利用上面十個文件訓練出十個HMM模板,具體方法是:首先將語音的波形文件分幀,以128個點為一幀,幀移為64,每一幀通過mfcc.m計算出13個系數,隨著波形的長度不同,一個語音文件可以計算得到13*N個系數,截取13*15的矩陣(mfcc系數)用作訓練數據。一般一個HMM模板用20組mfcc系數訓練,得到初始狀態分布、狀態轉移矩陣、高斯正態分布的均值和方差以及混合矩陣,這就是該語音的特征,存貯下來,識別的時候使用。(trainmfcc.m)
3、識別過程:識別的前面部分與訓練相似,都是要計算得到mfcc系數,不同在于,識別時,將計算得到的mfcc 參數分別代入訓練得到的HMM模板求出概率,比較出最大概率者,則該模板對應的數字就是識別的數字。(shibiesb.m)
4、用大量語音文件做測試,結果正確率為90%以上。(tongjijieguo.m)
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -