![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/98cdd72d-88e4-49d0-8879-2d8e4041a47b/98cdd72d-88e4-49d0-8879-2d8e4041a47bpic.jpg)
![基于HTK的漢語連續(xù)語音識(shí)別研究.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/98cdd72d-88e4-49d0-8879-2d8e4041a47b/98cdd72d-88e4-49d0-8879-2d8e4041a47b1.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、自動(dòng)語音識(shí)別(ASR,Automatic Speech Recognition)是通過機(jī)器識(shí)別和理解過程,把人類的語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。語音識(shí)別技術(shù)是一門綜合技術(shù),融合聲學(xué)、語音學(xué)、語義學(xué)、信號(hào)處理、心理學(xué),經(jīng)過近60年的發(fā)展,已經(jīng)取得了很大的進(jìn)展。目前在特定領(lǐng)域已經(jīng)能夠達(dá)到應(yīng)用的程度,但是要實(shí)現(xiàn)大詞匯量連續(xù)語音識(shí)別還有很多難點(diǎn)有待攻克,尤其是在說話人無關(guān)、高噪音的環(huán)境下,識(shí)別準(zhǔn)確度明顯下降。
本文主要研究
2、漢語連續(xù)語音識(shí)別中涉及的關(guān)鍵技術(shù)。建立語音識(shí)別系統(tǒng)的基本流程,語音信號(hào)處理的基本理論,著重研究了端點(diǎn)檢測(cè)方法、特征提取原理及方法。然后分別從兩個(gè)角度闡述漢語連續(xù)語音識(shí)別過程:模式識(shí)別角度和基于HTK的軟件識(shí)別過程。
首先,研究了漢語語音的特點(diǎn)。漢語屬于東方語系,在字形、發(fā)音方式方面與英語等西歐語系差別很大,因此要建立高質(zhì)量的語音識(shí)別系統(tǒng)需要對(duì)漢語語音的特點(diǎn)進(jìn)行深入研究。本文是基于隱馬爾科夫模型(HMM)的連續(xù)語音識(shí)別,特征
3、向量采用美爾倒譜系數(shù)(MFCC),基于上下文相關(guān)的三音素HMM,結(jié)合漢語特有的聲韻母加聲調(diào)的發(fā)音方式等一系列技術(shù),利用隱馬爾科夫模型工具箱(HTK)構(gòu)建了實(shí)驗(yàn)平臺(tái)。設(shè)計(jì)實(shí)驗(yàn)比較了不同高斯混合度(Mix)和不同音素模型下系統(tǒng)的表現(xiàn)性能。實(shí)驗(yàn)結(jié)果表明,采用上下文相關(guān)三音素模型識(shí)別精度達(dá)到98.00%,識(shí)別效果明顯。
其次,利用HTK工具包,設(shè)計(jì)實(shí)現(xiàn)了漢語連續(xù)語音識(shí)別模擬系統(tǒng)。本文介紹了HTK軟件包架構(gòu)及提供的模型分析工具,利用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于HTK的漢語連續(xù)數(shù)字語音識(shí)別研究.pdf
- 基于HTK的漢語數(shù)碼語音識(shí)別研究.pdf
- 基于HTK的連續(xù)語音識(shí)別技術(shù)研究.pdf
- 基于HTK的漢語連續(xù)語音識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于HTK的維吾爾語連續(xù)數(shù)字語音識(shí)別研究.pdf
- 基于Sphinx的漢語連續(xù)語音識(shí)別.pdf
- 基于HTK的連續(xù)蒙古語語音識(shí)別系統(tǒng)的研究.pdf
- 基于HMM的漢語連續(xù)數(shù)字語音識(shí)別.pdf
- 基于HTK和Microsoft Speech SDK的連續(xù)語音識(shí)別系統(tǒng)的研究及實(shí)現(xiàn).pdf
- 語音識(shí)別htk代碼學(xué)習(xí)手冊(cè)
- 基于音節(jié)的漢語連續(xù)語音聲調(diào)識(shí)別方法研究.pdf
- 帶噪環(huán)境下的漢語連續(xù)語音識(shí)別研究.pdf
- 漢語連續(xù)語音識(shí)別中自適應(yīng)技術(shù)的研究.pdf
- 漢語連續(xù)數(shù)目字語音識(shí)別的研究.pdf
- 漢語連續(xù)語音識(shí)別系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 噪聲環(huán)境下漢語連續(xù)語音聲調(diào)識(shí)別研究.pdf
- 噪音環(huán)境下漢語連續(xù)數(shù)字的語音識(shí)別.pdf
- 漢語連續(xù)語音識(shí)別中的動(dòng)態(tài)特性建模方法研究.pdf
- 噪聲環(huán)境下漢語連續(xù)語音識(shí)別技術(shù)研究.pdf
- 大詞匯量漢語連續(xù)語音的快速識(shí)別算法研究.pdf
評(píng)論
0/150
提交評(píng)論