可區(qū)分性原則在語音分離中的應(yīng)用.pdf_第1頁
已閱讀1頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、語音技術(shù)是現(xiàn)代計算機技術(shù)中非常重要的技術(shù)。人與人之間進行交流的最自然方式是語言。而現(xiàn)代計算機的使用是通過鼠標(biāo)和鍵盤輸入,通過顯示器、打印機等設(shè)備來得到計算機輸出的結(jié)果。這對人來說當(dāng)然不是最自然的交流方式。從這個意義上來說,現(xiàn)代計算機并不是最終的和最好的產(chǎn)品;而只是人類以自己對環(huán)境的適應(yīng)能力來屈就的產(chǎn)物。因此,一直以來,計算機科學(xué)家們都在尋找能夠使計算機能夠與人通過自然語言交流的技術(shù)。  但是直到現(xiàn)在,語音技術(shù)還沒有全面進入實用化、商用

2、化。主要是因為現(xiàn)代語音技術(shù)還有兩個關(guān)鍵的問題沒有完全解決。其一是噪聲環(huán)境下的語音增強和分離技術(shù);其二是完善的自然語言理解。  不能解決語音技術(shù)的這兩個非常關(guān)鍵的前、后端技術(shù),語音技術(shù)就不可能進入大規(guī)模應(yīng)用,只能是研究人員手中的玩具。  噪聲環(huán)境下的語音識別技術(shù)一直都是語音識別系統(tǒng)的重點和難點。但是在很長的時間中,由于相應(yīng)的數(shù)學(xué)方法和技術(shù)手段一直沒有得到發(fā)展,所以進步很慢。  隨著上世紀(jì)九十年代中期,高階統(tǒng)計學(xué)和分?jǐn)?shù)低階統(tǒng)計學(xué)應(yīng)用的

3、逐漸推廣,出現(xiàn)了從PCA(主成分分析)技術(shù)中發(fā)展出來的ICA技術(shù),從FA(因子分析)技術(shù)中發(fā)展出來的IFA技術(shù)。這兩種技術(shù)不需要知道信號的先驗知識,就可以幾乎很完美地分離出每一個信號。雖然這兩種技術(shù)都存在一定缺陷,由于技術(shù)本身顯示出來的能力,導(dǎo)致現(xiàn)代信號分離技術(shù)(特別是盲信號分離技術(shù)的)的迅速發(fā)展?,F(xiàn)在,盲信號分離技術(shù)在其他方向也取得了一定進步,并因此帶動了語音分離技術(shù)的進步。  通過對大量文獻(xiàn)的閱讀、研究、抽象和總結(jié),本文提出以下的

4、可區(qū)分性原則:  原始混合信號可投影于這樣的投影空間,在該投影空間中同一信號由于某些特征而在投影空間中密集分布,而信號之間由于這些特征的區(qū)別在投影空間中完全分離或者稀疏過渡;或者不同信號雖然聚集在一起,但是投影空間足夠稀疏而可以相互區(qū)分?! 〔⒃谠撛瓌t指導(dǎo)下,提出了以下信號分離的廣義框架:  1將信號投影到某一特征投影空間;  2在該投影空間中對信號的參數(shù)按照一定規(guī)則聚類;  3從投影空間將聚類后的信號向信號空間進行逆映射,重

5、構(gòu)信號?! ∫陨系膹V義框架就是信號分解技術(shù)的關(guān)鍵步驟。對于不同的算法,雖然進行分離的途徑之間極其不同,但是都要經(jīng)過以上的“投影—聚類—重構(gòu)”過程?! 』谝陨系目蓞^(qū)分原則和由此推出的信號分離的廣義框架,本文分析了各種可能的可以進行信號分離的投影空間,并對在這些空間進行聚類的技術(shù)進行了分析?! ≡诖嘶A(chǔ)上,本文將兩種相應(yīng)信號分離技術(shù)用到雙聲道語音分離技術(shù)。因為雙聲道語音分離往往需要分離出遠(yuǎn)多于聲道數(shù)的源信號。這時問題是超定的,需要用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論