基于麥克風陣列的語音識別方法研究.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近年來,隨著科技高速發(fā)展,人機交互的廣泛應用,語音識別技術得到了廣泛的關注。語音識別主要是指能夠讓計算機聽懂人所說的話,準確識別出語音的內容,并根據識別出的內容去執(zhí)行相應的操作。語音識別在車載導航、視頻監(jiān)控、機器人控制等領域有著非常廣泛的應用。目前單通道語音識別技術發(fā)展迅速,配合相應的去噪方法,在有噪環(huán)境下也能達到較為理想的識別率。然而與麥克風陣列相比,單通道語音識別存在一定的局限性。因此,麥克風陣列逐漸成為近年來的研究熱點。
 

2、 在識別系統(tǒng)中,訓練模型是使用在理想環(huán)境下錄制的語音。在實際環(huán)境中,待識別語音往往會混入環(huán)境噪音而導致識別率急劇下降。而使用一般的增強方法對語音做去噪增強,會使語音產生部分失真,同樣影響后端識別效果。針對此種問題,本文首先研究了單通道語音增強技術,并在此基礎上提出一種麥克風陣列增強系統(tǒng),在對語音信號做增強處理的同時又對信號做了失真補償,以此提高后端語音識別率。本論文具體研究工作和成果概述如下:
  1.研究了單麥克風在前端去噪增強

3、方面對語音識別準確性的影響。使用對數最小均方誤差(LogMMSE)和改進可懂度的維納濾波(wiener)相結合的語音增強方法,驗證了其在增強識別方面的效果。通過對比近年來的單通道語音增強算法,并針對這些算法設計了相關的語音識別實驗。實驗證明,LogMMSE級聯(lián)改進wiener的方法能在語音識別中取得很好的效果。
  2.研究了一種適用在低信噪比環(huán)境下的語音端點檢測算法。該算法將調制域譜減法和對數能量子帶譜熵相結合,首先通過調制域譜

4、減法去除帶噪語音噪聲,然后結合對數能量和改進子帶譜熵比算法對消噪后的語音信號進行特征計算。實驗結果顯示,在低信噪比環(huán)境下該方法能有效提高端點檢測正確率。
  3.在本課題組提出的雙微麥克風陣列基礎上,設計研究了一種雙微麥克風陣列,并通過雙微麥克風陣列采集語音數據庫。該方法通過利用相鄰陣元間信號的相關性進行初始噪聲抑制,再使用頻域寬帶最小方差無畸變響應(MVDR)保留目標聲源方向的信號并抵消其他方向的噪聲干擾,最后利用改進的維納濾波

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論