![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/af7a2016-5360-4f5c-8916-7a49c5f4b892/af7a2016-5360-4f5c-8916-7a49c5f4b892pic.jpg)
![基于GMM和BP網(wǎng)絡(luò)的語音轉(zhuǎn)換系統(tǒng)設(shè)計.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/af7a2016-5360-4f5c-8916-7a49c5f4b892/af7a2016-5360-4f5c-8916-7a49c5f4b8921.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、語音轉(zhuǎn)換技術(shù)是當(dāng)前語音信號處理領(lǐng)域的研究熱點之一,其在人機(jī)交互、語音修復(fù)、影視配音、語音偽裝和保密通信等方面有著廣泛的應(yīng)用。目前語音轉(zhuǎn)換的研究主要集中在頻譜包絡(luò)和韻律特征等的轉(zhuǎn)換上,但在對其的轉(zhuǎn)換上還未達(dá)到好的效果。本文在研究分析現(xiàn)有語音轉(zhuǎn)換算法的基礎(chǔ)上,設(shè)計構(gòu)建了基于高斯混合模型GMM和BP神經(jīng)網(wǎng)絡(luò)的語音轉(zhuǎn)換系統(tǒng),并完成了算法仿真和語音轉(zhuǎn)換系統(tǒng)實現(xiàn)。最后采用客觀評價和主觀評價方法對系統(tǒng)進(jìn)行了性能評價。
本文主要研究內(nèi)容如
2、下:
(1)在分析語音轉(zhuǎn)換的基本原理、語音的時域特性、語音的個性特征參數(shù)和語音轉(zhuǎn)換算法的基礎(chǔ)上,選取了語音信號的頻譜包絡(luò)及其殘差和基音周期作為語音轉(zhuǎn)換的特征參數(shù),選用了GMM模型和BP網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練和轉(zhuǎn)換。設(shè)計了基于GMM和BP網(wǎng)絡(luò)的語音轉(zhuǎn)換系統(tǒng)總體框架。
(2)完成了源和目標(biāo)說話人譜包絡(luò)LPC系數(shù)及頻譜包絡(luò)殘差的提取,在研究GMM模型基本原理的基礎(chǔ)上,用EM算法和K-Means算法對GMM模型的初始參數(shù)進(jìn)
3、行估計,利用估計的初始參數(shù)對提取的LPC參數(shù)進(jìn)行GMM模型訓(xùn)練,得到其映射函數(shù),并據(jù)此對源語音的LPC系數(shù)進(jìn)行轉(zhuǎn)換,仿真分析了基于GMM模型譜包絡(luò)的源、目標(biāo)和轉(zhuǎn)換后語音的時域波形和語譜圖。
(3)采用GMM模型完成了對源和目標(biāo)語音譜包絡(luò)殘差的訓(xùn)練,得到了源和目標(biāo)語音殘差碼本的映射關(guān)系,并通過映射關(guān)系對源語音的殘差進(jìn)行了轉(zhuǎn)換,仿真分析了基于GMM模型殘差的源、目標(biāo)和轉(zhuǎn)換后語音的時域波形和語譜圖。
(4)在分析討
4、論BP網(wǎng)絡(luò)基本原理和算法的基礎(chǔ)上,完成了源和目標(biāo)說話人的基音周期的訓(xùn)練,通過訓(xùn)練網(wǎng)絡(luò)實現(xiàn)了源與目標(biāo)說話人的基音周期的轉(zhuǎn)換,并仿真分析了源、目標(biāo)和轉(zhuǎn)換后的時域波形與語譜圖。
(5)完成了GMM和BP網(wǎng)絡(luò)兩種模型相結(jié)合后分別對說話人語音的頻譜包絡(luò)LSF參數(shù)、頻譜包絡(luò)殘差和基音周期三種特征參數(shù)的訓(xùn)練和轉(zhuǎn)換,仿真分析了轉(zhuǎn)換前后的時域波形和語譜圖;并完成了基于GMM和BP網(wǎng)絡(luò)的語音轉(zhuǎn)換系統(tǒng)功能設(shè)計及系統(tǒng)實現(xiàn),采用客觀評價和主觀評價的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于MFCC和GMM語音轉(zhuǎn)換技術(shù)研究.pdf
- 基于VQ模型和BP網(wǎng)絡(luò)的高自然度語音轉(zhuǎn)換.pdf
- 語音轉(zhuǎn)換關(guān)鍵技術(shù)研究及基于AMR的語音轉(zhuǎn)換系統(tǒng)設(shè)計.pdf
- 漢語語音轉(zhuǎn)換系統(tǒng)的研究.pdf
- 基于GMM和碼本映射相結(jié)合的語音轉(zhuǎn)換方法研究.pdf
- 特定目標(biāo)說話人的語音轉(zhuǎn)換系統(tǒng)設(shè)計.pdf
- 計算機(jī)語音轉(zhuǎn)換系統(tǒng)的研究.pdf
- 特定對象漢語語音轉(zhuǎn)換系統(tǒng)的研究.pdf
- 多參數(shù)驅(qū)動的年齡語音轉(zhuǎn)換系統(tǒng).pdf
- 語音轉(zhuǎn)換系統(tǒng)中特征參數(shù)的研究.pdf
- 基于LPAC-PSOLA合成算法語音轉(zhuǎn)換系統(tǒng).pdf
- 基于VxWorks的網(wǎng)絡(luò)地址轉(zhuǎn)換系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于改進(jìn)的GMM和頻率彎折的高質(zhì)量語音轉(zhuǎn)換算法的研究.pdf
- 基于BP神經(jīng)網(wǎng)絡(luò)的語音增強系統(tǒng)研究.pdf
- 方言轉(zhuǎn)換系統(tǒng)中的語音識別技術(shù)研究.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的語音轉(zhuǎn)換.pdf
- 語音特征提取及在音色轉(zhuǎn)換系統(tǒng)的應(yīng)用.pdf
- 基于FFMPEG的視頻轉(zhuǎn)換系統(tǒng).pdf
- 基于SWFTOOLS的文檔轉(zhuǎn)換系統(tǒng)設(shè)計與實現(xiàn).pdf
- 基于BP神經(jīng)網(wǎng)絡(luò)的低延遲矢量激勵語音編碼系統(tǒng).pdf
評論
0/150
提交評論