提出了一種用于矢量量化的改進的聚類算法,該算法在MKM(Modified K-Means)算法的框架的基礎上,對初始碼本的生成、失真測度的選擇、非典型胞腔的處理等方面進行了改進,從而減少了原算法在能量和增益上對聚類結果的影響.并將該算法應用于波形編輯孤立字識別器,這種識別器直接對語音樣本的時域波形進行訓練和聚類,不需要提取語音參數,算法復雜度較低,加上提出的聚類算法失真測度簡單易實現,對芯片的運算能力要求不高,非常適用于有低成本要求的語音識別器場合.通過中文元音字識別的實驗證明,在相同碼本尺寸下,運用改進后的聚類算法的識別器的識別率有所提高.
標簽:
Modified
K-Means
算法
MKM
上傳時間:
2017-05-30
上傳用戶:tianjinfan
語音識別技術是信息技術領域的重要發展方向之一,小詞匯量非特定人孤立詞語音識別是語音識別領域中一個具有廣泛應用背景的分支,在家電遙控、智能玩具、人機交互等領域有著重要的應用價值.語音識別芯片從20世紀90年代開始出現,目前的語音識別芯片都是以DSP為核心集成的語音識別系統,算法主要通過軟件實現,為了提高速度和降低成本,下一代語音識別芯片將設計成軟硬件協同實現,本文的目的是使用全硬件方法實現語音識別算法,為軟硬件協同實現的方案提供參考.本論文主要完成了以下工作:(1)在選定的FPGA平臺上,完成了整個系統的硬件設計.(2)對于硬件中難于實現而且占用較多資源的乘法器、求對數、求平方根以及快速傅立葉變換等關鍵模塊,本文都根據電路的具體特點,給出了巧妙的實現方案,完成了算法需要的功能.(3)設計中使用了模塊復用和流水線技術.(4)根據設計結果,給出了各個模塊占用的硬件資源和運行速度.實驗結果表明,本文所設計的硬件系統能夠正常工作,在速度和面積方面都達到了設計要求.
標簽:
FPGA
詞匯
語音識別
上傳時間:
2013-06-12
上傳用戶:01010101