![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/50a0ba65-fd8c-4df5-addc-772cf7d034e4/50a0ba65-fd8c-4df5-addc-772cf7d034e4pic.jpg)
![基于壓縮感知的說話人識別技術(shù)的研究.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/50a0ba65-fd8c-4df5-addc-772cf7d034e4/50a0ba65-fd8c-4df5-addc-772cf7d034e41.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、SpeakerRecognitionBasedonCompressedSensingADissertationSubmittedtoSoutheastUniversityFortheAcademicDegreeofMasterofEngineeringBYLVZhenSupervisedbyProlessorZouCairong—SchoolofInformationScienceandEngineeringSoutheastUnive
2、rsityMarch2014摘要摘要隨著信息技術(shù)和網(wǎng)絡(luò)通信的快速發(fā)展,人們對信息安全性的要求越來越高,說話人識別技術(shù),憑借其較高的安全性和便捷的使用方式,廣泛地被應(yīng)用于互聯(lián)網(wǎng)和通信領(lǐng)域,完整的說話人識別系統(tǒng)由預(yù)處理、特征提取、模式匹配和判定這幾塊共同構(gòu)成,自Bell實驗室的LGKesta提出了“聲紋”的概念后,大量學(xué)者針對說話人識別技術(shù)中不同模塊展開研究,收獲頗豐。目前,與文本相關(guān)的說話人識別技術(shù)的研究相對較為成熟,識別性能較好,但是與
3、文本無關(guān)的說話人識別技術(shù)性能的提升空間還很大,除此之外,由于現(xiàn)實生活中絕大部分的語音信號都含有噪音,而傳統(tǒng)的說話人識別算法大多針對干凈語音,因此尋找一種魯棒性較好的說話人識別技術(shù)也迫在眉睫。另一方面,近幾年,壓縮感知理論受到國內(nèi)外的廣泛關(guān)注,該理論突破了奈奎斯特采樣速率的限制,對可壓縮信號在采樣的同時也進行壓縮,將壓縮感知這一新理論與說話人識別這一亟需突破的領(lǐng)域相結(jié)合,為說話人識別系統(tǒng)性能的提升帶來希望,具有重大的實際應(yīng)用價值。本文在對
4、壓縮感知理論和說話人識別技術(shù)進行深入學(xué)習(xí)的基礎(chǔ)上,針對與文本無關(guān)的說話人識別技術(shù),做了以下工作:1)研究了稀疏表示理論在模式識別領(lǐng)域中應(yīng)用,分析了稀疏表示理論和壓縮感知的聯(lián)系與區(qū)別,提出用組合特征矢量訓(xùn)練GMM均值超向量,并以此為基礎(chǔ)構(gòu)建稀疏基,隨后提出了一種基于壓縮感知稀疏表示的說話人識別算法,為兩種理論的結(jié)合開辟了思路;2)深入研究了貝葉斯框架下的壓縮感知算法,給出了區(qū)別于傳統(tǒng)重建算法的貝葉斯重建算法,鑒于該算法得到的解更接近于最小
5、厶范數(shù)的解,率先提出了基于貝葉斯壓縮感知的說話人識別算法;3)針對基于壓縮感知的說話人識別算法中的稀疏系數(shù)的特點,引入半高斯先驗,詳細分析基于該先驗的貝葉斯壓縮感知后,提出基于近似貝葉斯壓縮感知的說話人識別算法;4)針對說話人識別系統(tǒng)在噪聲環(huán)境下識別率普遍較低的問題,在詳細分析語音信號和噪聲信號稀疏性差異后,提出了一種基于壓縮感知的語音增強算法,并將其應(yīng)用在說話人識別前端。本文最后對所做的工作和成果做了總結(jié),并對今后的工作進行了展望。關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于壓縮感知的魯棒性說話人識別.pdf
- 基于壓縮感知的魯棒性說話人識別技術(shù)研究.pdf
- 基于壓縮感知人臉識別技術(shù)的研究.pdf
- 基于壓縮感知的聲發(fā)射識別技術(shù)的研究.pdf
- 基于壓縮感知的語音情感識別技術(shù)的研究.pdf
- 基于非重構(gòu)壓縮采樣的抗噪說話人識別技術(shù)研究.pdf
- 基于GMM的說話人識別技術(shù)研究.pdf
- 自動說話人識別技術(shù)的研究.pdf
- 基于特定文本的說話人識別技術(shù)研究.pdf
- 基于壓縮感知的音樂識別研究.pdf
- 基于說話人識別技術(shù)的身份認證系統(tǒng).pdf
- 基于深度學(xué)習(xí)的說話人識別技術(shù)研究.pdf
- 基于EMD的說話人識別研究.pdf
- 說話人識別相關(guān)技術(shù)的研究.pdf
- 基于文本無關(guān)的說話人識別技術(shù)的研究.pdf
- 說話人識別技術(shù)的研究與改進.pdf
- 基于壓縮感知的實際環(huán)境人臉識別技術(shù)研究.pdf
- 基于漢語元音映射的說話人識別技術(shù)研究.pdf
- 基于文本無關(guān)的說話人識別技術(shù)研究.pdf
- 基于高斯混合模型的說話人識別技術(shù)研究.pdf
評論
0/150
提交評論