![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-10/21/23/02ac7353-8862-4204-8049-8fd053b04d5f/02ac7353-8862-4204-8049-8fd053b04d5fpic.jpg)
![數字語音編碼作者趙曉群第7章節(jié)語音信號的線性預測分析課案_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-10/21/23/02ac7353-8862-4204-8049-8fd053b04d5f/02ac7353-8862-4204-8049-8fd053b04d5f1.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、國家“十一五”規(guī)劃教材《數字語音編碼》講議同濟大學電子與信息工程學院趙曉群 編著機械工業(yè)出版社,2007年,第7章 語音信號的線性預測分析(LPC)7.1 概述 ◆ 1947年美國科學家N.Wiener提出 線性預測理論,創(chuàng)立了控制論?!?1948年美國科學家C.E.Shannon提出 信息的測度理論,創(chuàng)立了信息論?!艟€性預測(縮寫:LP)◆線性預測分析(縮寫:LPC) LP理論:一種適用廣泛的數學理論,應用于
2、許多領域;1967年日本學者Itakura(板倉)等將LP技術應用于語音分析和語音合成,數字語音技術獲得巨大的發(fā)展。,線性預測已普遍地應用于語音信號處理的各個方面?!魠倒烙嫞夯糁芷?、共振峰頻率、譜特征、 聲道截面積函數等◆特點:LPC能精確估計語音參數,用少量參數有效表示語音, 計算LPC參數較簡單。LPC基本思想:◆利用信號間相關性,用過去值預測現在或未來的值, 即用過去若干個取樣值的線性組合逼近一
3、個取樣值?!粼谀撤N測度準則下,通過使實際的取樣值與預測值之間的差別達最小,確定唯一的一組預測系數。語音的LPC系數:可于語音編碼、語音合成和語音識別等。LPC的基本原理和語音信號數字模型密切相關 本章內容:LPC基本原理、計算方法以及應用問題。,第7章 語音信號的線性預測分析7.2 LPC的基本原理 7.2.1 信號模型時間序列可模型化為白噪聲序列作用于數字濾波器H(z)的輸出。H(z)通常為有理分式的形式:
4、 ,模型參數:ai,bi ——系數, , G ——增益因子。圖7.1:信號x(n)的模型化。 x(n)、X(z) —— 模型化的信號和其 z 變換, u(n)、U(z) —— 模型的激勵和其 z
5、變換。 ◆ z 域關系式: ◆時域關系式:物理意義: x(n)由其過去值及模型輸入的線性組合來預測得到。,x(n) 為零均值的隨機信號時, 系統的輸出、輸入關系可用相關函數或功率譜來表征 : 式中,Rxx(z) —— 信號 x(n) 的自相關函數的 z 變換; Ruu(z) —— 輸入 u(n) 的自相關函數的 z 變換。 ◆通常,u(n) 是零均值、 方差白噪聲序列,因此
6、有: ◆假設 ,則本頁第一式的變換寫成功率譜形式,有: ◆上式表明,信號 x(n) 的功率譜完全由濾波器的幅頻響應決定。 即系統 H(z) 確實可以用來模型化信號 x(n)。上式是用模型參數分析法估計隨機信號的理論依據。,,信號模型分三種(按濾波器的有理分式): ◆ ARMA模型:傳遞函數含有極點和零點(零極點模型) 。 (自回歸?滑動
7、平均模型) ARMA模型產生的序列稱為ARMA過程序列?!?AR模型:傳遞函數的分子多項式為常數(全極點模型)。 (自回歸模型) 輸出只取決于過去的信號值。 AR模型產生的序列稱為AR過程序列?!?MA模型:傳遞函數的分母多項式為常數(全
8、零點模型)。 (滑動平均模型) 輸出只由模型的輸入來決定。 MA模型產生的序列稱為MA過程序列。ARMA模型是AR模型和MA模型的混合結構。,求解模型參數的過程通常是一個逼近過程(有精度問題)?!舴椒ㄊ窍却_定極點和零點的個數,然后將 u(n) 送入系統, 得到的輸出將是 x(n) 的近
9、似值 ?!舨捎媚撤N逼近準則,使 逼近 x(n) 。 語音信號處理中最常用的模型是全極點模型。語音信號處理中使用全極點模型的理論依據: (1) 不考慮鼻音和摩擦音,則聲道傳遞函數是全極點模型; 若考慮鼻音和摩擦音,則聲道傳遞函數有極、零點。 一個零點可以用多個極點來近似,依據為: (2) 用LPC法估計全極點模型參數,求解線性方程組;
10、 而模型中含有限個零點時,則求解非線性方程組。,7.2.2 LPC誤差濾波p 個極點的全極點模型的傳遞函數H(z): ◆ 輸入和輸出之間滿足差分方程:定義線性預測值為: 式中,a1,a2,…,ap —— LPC系數?!羯鲜椒Q為線性預測器,預測器的階數為 p 階。 p 階線性預測器的傳遞函數有如下形式:,LPC誤差e(n) :信號值 x(n) 與線性預測值 之差。 ◆ e(n)
11、 是 x(n) 通過如下系統轉移函數的系統的輸出: ◆稱系統 A(z) 為LPC誤差濾波器,如圖7.2所示。 ◆ A(z) 是 AR(p) 模型 H(z) 的逆濾波器, 關系式為:設計預測誤差濾波器 A(z) 就是求解預測系數, 使誤差在某個預定的準則下最小,稱為LPC分析。常用的誤差準則:方均誤差最小準則。,求解LPC預測系數 ◆將方均誤差 E[e2(n)] 對各個系數 ai 求偏導,并令為零,得
12、 代入 ,可推得: 將上式 代入第一式,得:◆上式為LPC中的重要結果,稱為正交方程。◆正交方程表明:預測誤差 e(n) 與信號 x(n) 的過去 p 個取樣值x(n-1), x(n-2),…, x(n-p) 是正交的。,,,正交方程,推導正交方程的另一種形式
13、?!魧?代入正交方程,整理得: 改寫為: 式中, ◆上式為LPC中的一個重要結果,稱為標準方程式。 ◆ p 個預測系數a1,a2,…,ap可通過解標準方程式得到, ◆ 求得的 p 個預測系數將使 預測誤差濾波器的輸出方均值或者輸出功率最小。,標準方程式,正向預測誤差功率:最佳預測時,誤差的最小方均
14、值,即 因 ,代入上式,得 即:◆注:上式成立條件,最佳預測系數時?!艉喜藴史匠淌胶蜕鲜?,最后得到: ——稱為標準方程。可解出 p+1個未知數a1,a2,…,ap,Ep。,標準方程,p+1個線性方程,已知信號的相關函數c(j,i)。,特殊情況:若信號恰為一個
15、 p 階的過程序列, 其信號模型的傳遞函數: 模型的時域 差分方程: 其中,輸入的激勵信號u(n) 是零均值、方差為 1 的白噪聲序列?!舾膶懖罘址匠虨椋?(*) 式(*) 兩邊乘 x(n-j),求平均值,因E[u(n)x(n-j)]=0 ,有: 式(*)
16、兩邊乘x(n),求平均值,類似地有: 比較上兩式與式 , 可發(fā)現預測系數和信號模型參數滿足相同的方程組,G=Ep。,結論: (1)已知模型階數 p 的AR過程序列,按LPC設計A(z)時, 所得預測系數和該模型相應的模型參數有相同的值; (2)
17、未知模型階數 p ,或過程模型含零點時, 可認為LPC提供了該過程信號模型的一個估計?!?LPC分析是估計隨機信號功率譜的一種有效方法。 p=有限值,預測濾波器A(z)為FIR濾波器,只有零點。 與AR(p)模型對應。p=∞,預測濾波器A(z)有下面形式: 對應于信號模型中的ARMA過程。,7.2.3 語音信號的LPC分析 語音序列為緩變的隨機序列,可近似用信號模型化方法分析。圖7.3:信
18、號模型化的思想建立的語音信號的產生模型?!魧⑤椛洹⒙暤?、聲門激勵的譜效應簡化為時變數字濾波器, 其穩(wěn)態(tài)系統函數為: 語音信號x(n)被模型化 為一個過程序列。◆濁音激勵為準周期沖激序列,◆清音激勵為白噪聲序列。H(z)稱為合成濾波器。模型參數:濁/清音判決、 基音周期、增益常數G、 數字濾波器參數a1,a2,…,ap。,求解濾波器參數和增益常數的過程稱為語音信號的LPC分析。 ◆基本問題是從
19、語音信號序列確定一組LPC系數。 ◆預測系數的估計須在一短段(幀)語音信號的范圍內進行。 激勵源問題: ◆清音:用模型合成語音時,產生的序列與和被分析序列 有相同的譜包絡特性。 ◆濁音:激勵源 u(n) 的譜是一組幅度相同的諧波線譜, 與模型化中的信號源假設有所不同。 但激勵源 u(n) 的大部分時間的值
20、非常?。阒担?, 由于方均預測誤差最小準則使預測誤差e(n)逼近于u(n) , 與u(n)能量很小這一事實并不矛盾。 ◆因此,為不使問題復雜化,認為模型適于清音、濁音。,使用全極點模型進行語音信號LPC分析的主要缺點: (1) 理論上,語音是極零點模型(特別是清音和鼻音), 應該用 ARMA模型; (2) 模型中,對于濁音時,激勵源不滿足白噪聲的假設條件。近期研究,
21、努力解決這些問題。 全極點模型求解方便,在相當廣泛的條件適于工程, 在數字語音信號處理的眾多領域得到了非常成功的應用。,第7章 語音信號的線性預測分析7.3 LPC分析的解法 求信號模型參數可以通過LPC完成; ◆ LPC系數以及預測誤差功率可從下式標準方程解出: ◆解線性方程組的方法有多種, ◆以系數矩陣的特殊性質可簡化解法。標準方程的系數矩陣中, 的值取決于求數學期望的方法。 ◆c(j,
22、i)的定義不同,導致不同的LPC解法。經典解法:自相關法、協方差法。,7.3.1 自相關法假定 x(n) 在 0≤ n ≤N-1以外為零( N 長加窗截取)。 ◆截取序列為:x(0),x(1),…, x(N-1) ; ◆ c(j,i)是加窗的信號序列x(n)的自相關函數 r(j-i),即: ◆將r(j,i)代入標準方程中,寫成矩陣形式,得: 式中,預測系數 ai 用 ap,i代替(p 特指是
23、 p 階預測系數)。上式稱為Yule–Walker(尤利–沃爾克)方程。,特點:主對角線和與主對角線平行的斜對角線上, 該方程組的系數矩陣的元素相同,具有這樣性質的矩陣稱為Toeplitz(托普利茲)矩陣;同時該系數矩陣是對稱矩陣。,利用對稱Toeplitz矩陣性質,Yule–Walker方程可用Levinson–Durbin(萊文遜–杜賓)遞推算法高效地求解。 ◆算法的計算復雜度為 O(p2)(一般解
24、法復雜度為 O(p3))。設已知 p-1 階Yule–Walker方程的解為: 則有:◆由方程的系數矩陣的對稱特點知,將 p 階和 p-1 階兩方程中 后面兩個列矢量倒置,再代入到原方程中,等式保持不變。,◆設 p 階方程的解為 p-1 階方程解的一種線性組合:并代入 p-1 階方程,得:式中,,◆要使左式為待求方程式(見上頁)的解,要求下式右邊的矢量,除第一個元素外,均為零。
25、 ◆需通過選擇 kp,使其滿足q-kpEp-1=0即: kp=q/Ep-1 。,由上頁結果,可推出: 將上式代入解表達式(見上頁),得LPC系數的遞推公式為: ◆比較上面兩個方程,知:在每次遞推求解過程中,系數 ki, i=1,2,…,p 起到關鍵作用?!衾碚摲治觯簁i 為無損級聯聲管的反射系數或偏相關系數。以上三式是Levinson–Durbin的遞推公式。Levinson–Durbin的計
26、算量:乘法 p2 次,除法 p 次。,計算量:乘法 (p2-p)/2 次, 除法 p 次。,計算量:乘法 (p2-p)/2 次。,計算量:乘法 p 次。,Levinson–Durbin算法的遞推步驟: (1) 初始化: ; (2) 已知p-1階預測器的參數:
27、 ; (3) 計算 p 階預測器的反射系數: (4) 計算 p 階預測器的預測參數和誤差能量: (5) 返回第(2)步。 ◆當遞推過程達到指定的階數時,終止計算。計算得三類結果:各階預測器的預測系數; 各階預測器的反射系數; 各階預測器的預測誤差
28、功率 。,從式 可以得到:◆結論:(1) 最小預測誤差能量 Ep > 0,且隨階數 p 增大而減小。 (2)反射系數 ki 滿足: (3) 時,系統穩(wěn)定;H(z) 的根在單位圓內。,7.3.2 協方差法自相關法定義 c(j,i) 為: ◆需 N 個 x(n) 樣本:x(0), x(1), …, x(
29、N-1), 可加窗;協方差法定義 c(j,i) 為: ◆需 N+p 個 x(n) 樣本: x(-p), x(-p+1), …, x(N-1) 或定義 c(j,i) 為: ◆需 N 個 x(n) 樣本:x(0), x(1), …, x(N-1); ◆此時,預測誤差在 [p, N-1] 范圍內為最小。嚴格講,協方差法定義的 c(j,i) 是:
30、 兩個相似的信號序列段間的互相關函數。相關函數的微小的不同,使LPC方程組解法有很大不同。,將標準方程 寫成矩陣形式: ◆協方差法不需要加窗,計算精度大大提高。缺點:不保證 ,即不保證系統的穩(wěn)定性; 進行線性預測時,
31、需隨時判定 H(z) 的極點位置, 并加以修正,才能得到穩(wěn)定的結果。,對稱系數矩陣,不具有Toeplitz性質。自相關法的求解捷徑無效,而需要新的解法。,Choleskey(喬里斯基)分解法解協方差方程: ◆將標準方程式 中的第一個寫成矩陣形式: 式中,C 是 p×p 階正定對稱矩陣,A 和 B 是列矢量:◆正定性的系數矩陣 C 可分解為: 式中,V 是下三角矩
32、陣,主對角元素=1;D 是對角矩陣:,令式 兩邊的第 (i, j) 項元素相等,可得: 解得: ◆確定矩陣 V 和 D 后,分兩步確定列矢量 A。 由 得: , 令: , 有:
33、 或:,,利用該組式,可得遞推解法。,(1) 由 解得矢量 Y 元素: (2) 由 ,解得矢量 A 元素: 上兩式與下式構成Choleskey分解法的計算過程。分析計算量:以上三式均需1/di,計算一次需 p 次除法; 分析乘法量:Choleskey分
34、解法的計算量:乘法 (p3+9p2-10p)/6 次, 除法 p 次。,計算量:乘法 (p2-p)/2 次。,計算量:乘法 (p3+3p2-4p)/2 次。,計算量:乘法 (p2-p)/2 次。,7.3.3 自相關法與協方差法的比較自相關法適應于平穩(wěn)信號,協方差法適用于非平穩(wěn)信號。由經驗可知,對摩擦音,自相關法較好;
35、 對于周期性語音,協方差法較好。 Levinson–Durbin和Choleskey均可有效求解相關方程。自相關法略微簡單一些。 自相關法時需要用窗函數截取信號,引入了誤差, 求解精度不高,這是自相關法本質性的缺點。協方差法無需加窗處理,計算精度大大提高,所得到的協方差系數能更精確地代表語音信號。協方差法的主要缺點:可能會產生不穩(wěn)定的逆濾波器。,第7章 語音信號的線
36、性預測分析7.4 格型法及其改進 1970年代初,板倉(Itakura)提出預測逆濾波器的格型結構。格型法特點:在運算中不需要窗函數加權,同時保證解的 穩(wěn)定性,較好解決了精度和穩(wěn)定性間的矛盾。提出正向預測和反向預測概念,增加了選擇方均誤差準則的 靈活性,衍生出系列格型結構的新的LPC算法。Burg從最大熵譜分析的觀點也得到了相似
37、和等價的結果。格型法運算量:比自相關法或協方差法大 4 倍左右。Makhoul提出改進的協方差格型法: 該方法可使運算量恢復到自相關法或協方差法的水平, 同時保持較高的精度和解的穩(wěn)定性。,7.4.1 格型法基本原理定義:正向預測和反向預測的概念。Levinson–Durbin算法遞推到第 p 階的預測系數:定義: p 階LPC誤差濾波器為: ◆ Ap(z) 的輸入信號為x(n),輸出預
38、測誤差為 e(n)= ep(n),有: 時域關系: z 域關系:,由Levinson–Durbin遞推算法知, p 階預測器的遞推解可寫為: (見前面推導) 式兩邊左乘 ,得: 即:◆將上式代入式
39、 中,得:式中,Bp(z) 及其逆 z 變換 bp(n) 為:,定義:正向預測誤差 fp(n)的 z 變換為Fp(z)= Ep(z)。定義:反向預測誤差 注:f,F 表示正向, b,B 表示反向。 圖7.4:兩種預測示意圖。,推導格型濾波器的結構?!粲汕懊嬷?Fp(z)的逆 z 變換為:◆將式
40、 (將變換 z 用 z-1 替代) 代入式 ,得: Bp(z)的逆 z 變換為:◆當 p=0時,由正向預測誤差和反向預測誤差的定義式,得:注:上面三個綠色公式是構造格型濾波器的關鍵式。,綜合上頁三個關系式,得遞推關系:◆上式是構造格型(分析)濾波器的重要表達式。圖7
41、.5:格型分析濾波器的結構?!舨V器的輸入為信號 x(n), 輸出為正向預測誤差x(n) ,亦即預測誤差 e(n) 。,上頁三個關系式可改寫為:◆上式是構造格型(合成)濾波器的重要表達式。圖7.6:格型合成濾波器的結構。 格型合成濾波器可用于數字語音模型中的合成濾波器 H(z)。◆格型濾波器由 p 節(jié)構成,關鍵參數僅為反射系數 ki。,7.4.2 格型法求解可設計出多種最優(yōu)準則
42、(規(guī)則)求解反射系數, 衍生出多種格型法求解算法。根據格型的結構形式特點,分別定義: 正向方均誤差: 反向方均誤差: 交叉方均誤差: 依據三種方均誤差定義,所衍生出的幾種常用的格型法: 1.正向格型法 4.Burg(伯格)法 2.反向格型法 5.協方差格型法
43、 3.幾何平均格型法,1.正向格型法逼近準則:使第 p 節(jié)正向方均誤差 epf(n) 為最小?!袅?,利用正向預測誤差定義式 得: 即:◆在實際運算時總是用時間平均近似代替集合平均。 為提高計算精度,可不限制 x(n) 的長度范圍,上式可寫成:,2.反向格型法逼近準則:使第 p 節(jié)反向方均誤差 epb(n) 為最小。
44、◆令 ,利用反向預測誤差定義式 得: 即:◆在實際運算時總是用時間平均近似代替集合平均。 為提高計算精度,也不限制 x(n) 的長度范圍,上式可寫成:,3.幾何平均格型法該方法不采用逼近準則,而采用逼近規(guī)則?!舳x:反射系數為epf(n) 和epb(n)的幾何平均值: 整理得: 式中,sgn(x) 是取 x 的符號函數
45、。 ◆這種方法確定的反射系數保證合成系統是穩(wěn)定的。◆可證明:,4. Burg(伯格)法逼近準則:使第 p 節(jié)epf(n)+epb(n)為最小?!袅?,利用正、反向預測誤差式,得: 即: 或:◆這種方法確定的反射系數將保證合成系統是穩(wěn)定的?!艨勺C明:,5.協方差格型法格型法計算量:大(約為自相關法或協方差法的4倍以
46、上 ) ◆需要算:fp(n)、bp(n)、kp、LPC系數。 ◆特點:多次調用相同的語音取樣值,可簡化計算的可能。協方差格型法:格型法的改進算法,可減少運算量。改進思路:去掉 c(i,j) 中冗余計算,化簡預測誤差的計算。 仍可以不同誤差準則求解,既保持格型法的靈活性、 解的穩(wěn)定性和精確性,又使運算量與自相關法相當。,協方差c(i,j)的定義式:
47、 或:◆考慮對稱性,約定僅使用 c(i,j),i≥j。◆利用 c(i,j) 與 c(i-1,j-1) 之間的關系,減少計算量。◆當信號 x(n) 的長度定義在 -p≤ n ≤N-1內時,有: 得:◆當信號 x(n) 的長度定義在0≤ n ≤N-1內時,有: 得:◆結合上面兩綠式,得 c(i,j) 與 c(i-1,j-1) 之間的關系式見下面,,,,,兩式相減,,,兩式相減,,,◆將上式分別代
48、入各預測誤差表達式,化簡后得:,協方差格型法的求解分為四個主要步驟:(1) 利用式 由輸入信號 x(n) 計算所需要的協方差c(i,j);(2) 利用下式計算預測誤差:(3) 利用格型法求解反射系數:ki;(4) 計算LPC系數:ap,i?!魠f方差格型法的實際運算量可以大幅度下降。,7.4.3 各種LPC分析方法的比較分析:(經分析) ◆運算量:協方差法的運算量略高于自相關法。
49、 格型法的運算量與協方差法相近。 ◆運算量:自相關法、格型法可保穩(wěn)定,協方差法不保穩(wěn)定。 實際參數時,協方差法基本保穩(wěn)定。,第7章 語音信號的線性預測分析7.5 LPC的頻域特性 7.5.1 最小預測誤差的頻域解釋 x(n) —— 語音信號, e(n)——預測誤差; A(z), A(ejω) —— 預測誤差濾波器; H(z),H(ejω
50、) —— 合成濾波器; 則有:◆設:X(ejω) = F [x(n)], E(ejω) = F [e(n)]。 由Parseval定理,得:,因 是用全極點模型估計的語音譜 ,即有:◆上頁式寫成:◆ min E[e2(n)] 等效于語音譜與全極點模型估計譜的 比值的積分值最小。頻域上,LPC的原理:
51、給定語音信號的譜 , 期望用一個 p 階全極點濾波器作為其模型, 該模型輸出的譜 使其比值的積分最小。,定義:預測誤差信號的譜平坦度:◆譜平坦度 f 是指譜的幾何均值與算術均值之比,0≤ f ≤1。 恒定譜的平坦度等于 1。min E[e2(n)] 可以看成是使 E[e2(n)
52、] 的譜最平坦, 或者說具有最大的譜平坦度。,7.5.2 LPC譜估計LPC分析:可看成用全極點譜逼近語音信號譜的譜匹配問題, 也是用全極點模型估計語音信號的譜的譜估計問題。LPC分析:是求解信號模型參數的有效的方法, 也是估計隨機信號功率譜的有效方法。語音模型的 H(z) 是聲道響應、聲門激勵及輻
53、射組合效應的 模型,它使用全極點形式。若語音信號 x(n) 確實是一個 p 階AR過程,則LPC分析的預測系數恰好等于 H(z) 的參數,且有: 式中, H(ejω) 是模型 H(z) 的頻率響應,簡稱為LPC譜。,語音信號并非 p 階AR過程,LPC應理解為語音的譜估計。 ◆多數輔音(清音)和鼻音,應用極零點模型表示; ◆一個零點能夠用無窮多個極點來逼近,
54、 即極零模型可用無窮高階的全極點模型來逼近。語音信號應為ARMA過程,但階數足夠大,全極點模型譜則以任意小的誤差逼近語音信號譜,即: 注:p→∞,表明成立式: 因相位的因素,但不一定成立式:圖7.7:元音 [ou] 的LPC譜實例。,圖7.8:元音段 [æ] 的LPC譜和語音信號譜的比較。 ◆信號譜由FFT分析得到; LPC譜: Hamming窗, 14 階,自相關法; ◆該信號的譜有很好
55、的諧波結構; 在信號譜的峰值處,LPC譜和信號譜匹配良好; 在信號譜的谷底處,LPC譜和信號譜匹配較差;濁音語音譜,在諧波成分處 匹配效果要遠比諧波之間好得多。原因:源于方均誤差最小的準則, 譜值大時誤差要小。,階數 p 的選擇:從譜估計精度、計算量、存儲量等綜合考慮, 與LPC求解方法無關。 ◆一般原則
56、:先保證足夠的極點模擬聲道響應的諧振結構。 通常,每kHz兩個極點(或共軛極點)表征聲道響應, 需 3~4 個極點逼近可能的零點、聲門激勵和輻射效應。 ◆10 kHz取樣時,要求12~24階數。圖7.9:歸一化預測誤差與 p 的變化曲線。 ◆ p 增加,預測誤差趨于下降, ◆ p=12~14 時,誤差變化基本趨于平緩。 ◆清音比濁音的歸一化預測誤差高得多,
57、 即濁音時估計精確。 ◆ p 增加,LPC譜有更多的信號譜細節(jié)。若譜估計關注聲道諧振特性,取 p=12~14。,幀長 N 的選擇: (N 小,則求解LPC參數的計算量?。┳韵嚓P法:一般 N 不低于兩個基音周期,為 20 ~ 30 ms。協方差法和斜格法: 因無需加窗,理論上幀長小到什么程度沒有實際限制, 但是估計譜的精度隨著 N 的增加而提高。一般,幀長 N 取 2~3 個基音周期才是合理的
58、 語音信號譜的高頻分量小,常采用預加重提高之。,7.5.3 LPC倒譜聲道模型的系統函數H(z): H(z) 的激勵響應為 h(n)。先求序列 h(n) 的倒譜 ?!舾鶕瑧B(tài)處理方法,有: ◆因 H(z) 是最小相位的(單位圓內解析),故 可展開: 即存在 的逆變換 ,且 ?!?/p>
59、將 對 z-1 求導數,考慮到上 3 式,經整理得:◆由恒等式,得:,◆倒譜的遞推公式,基于 LPC 預測系數推得,◆稱為 LPC 倒譜?!衾昧俗钚∠辔惶匦?,避免相位卷繞問題。,分析倒譜,可分別估計語音信號短時譜包絡和聲門激勵參數。估計語音信號的短時譜包絡的方法有:(1) 按式 ,從LPC系數估計短時譜包絡;(2) 對信號
60、作FFT、對數變換,后求逆FFT,用適當的輔助因子 獲得倒譜,并用低時窗取出譜包絡信息。(3) 從LPC倒譜求短時譜包絡。 圖7.10:三種短時譜包絡的實例?!?FFT和LPC法的頻譜包絡接近, 后者比前者更好地重現譜的峰值?!羲鼈兌急戎苯訌腖PC系數導出 的頻譜包絡要平滑得多?!鬖PC倒譜法運算量小。,第7章 語音信號的線性預測分析7.6 線譜對分析 線譜頻率(LSF):與LPC系數、反射系數等
61、價的另一種 系數。也稱為線譜對(LSP)?!?LSP 是頻域參數,與語音信號譜包絡的峰有更緊密的聯系。◆ LSP優(yōu)點:其合成濾波器與反射系數一樣,易保證穩(wěn)定性, 而參數的量化和內插特性均優(yōu)于反射系數, 使相同質量的合成語音所需的數碼率得以降低?!鬖SP缺點
62、: 運算量較大。,7.6.1 線譜對分析原理p 階LPC誤差濾波器的傳遞函數為:定義: p+1 階多項式: ◆則:◆不難看出,P(z) 相當于 kp+1=-1 時的 Ap+1(z), Q(z) 相當于 kp+1=1 時的 Ap+1(z)??勺C明:A(z) 的零點在 z 平面單位圓內時, P(z)和Q(z)的零點 都在單位圓上,并且沿
63、單位圓上隨 ω 的增加交替出現。,◆ P(z)是對稱實系數的 p+1 階 多項式,以-1為根;◆ Q(z)是反對稱實系數的 p+1 階多項式,以+1為根。即:,設: ◆易得系數間的關系為: ◆若 p 是偶數,設 P(z) 的零點為 , Q(z) 的零點為 , 則 P(z) 和 Q(z) 可寫成因式分解形式:◆ ωi、θi 的值排列為:◆ ωi和 θi
64、 成對出現,反映了譜的特性,稱之為線譜對(LSP)。,◆ P’(z)、Q’(z)的系數也是對稱的;◆且α0=β0=0?!魹楣曹棌透骸羝浠疽蚴剑?當 p 為奇數時,可以同樣求得LSP參數的表達式。 P(z)、Q(z)的零點互相分離,是合成濾波器穩(wěn)定的充要條件;即:在單位圓上, P(z) 和 Q(z)不可能同時為零。LSP參數和語音譜特性之間有密切的聯系。 語音譜可由LPC模型譜來估計,而LPC譜可以寫成: ◆
65、若ωi 和 θi 很靠近,則當 ω 接近這些頻率時, 變小, 顯強諧振特性,語音譜包絡在這些頻率處出現峰值。LSP分析是用 p 個離散頻率 ωi 和 θi 的分布密度 表示語音信號譜特性的一種方法。,分析: 1. 當ω 接近 0 或 θi,i=1,2,..時,括號內的第一項接近于零; 2. 當 ω 接近π 或 ωi,i=1,2,..時,括號中第
66、二項接近于零。,一般不直接利用LSP參數去構成聲道模型參數。 主要原因: ◆用LPC系數構成聲道模型參數比較容易, LSP參數與聲道模型的 z 域表示是隱性關系, ◆ LPC系數到LSP參數的轉換是可逆的。 LPC參數廣泛應用于各種語音編碼、語音合成和語音識別等應用領域中。實驗表明:表達LPC參數的最有效方式為LSP參數。
67、 ◆一個LSP參數的誤差僅僅影響全極點模型中鄰近這個參數 對應頻率處的語音譜,而不影響其他地方。 ◆對敏感頻率段對應的LSP參數分配較多的比特數, 對不敏感頻率段對應的LSP參數分配較少的比特數。 ◆在相對低的碼率上,使用LSP參數能獲得高質量的語音, 主觀性能也表明它能產生高質量的合成語音。,LSP參數的主要性質: (1) 保持LSP參數的有序有界性質,就保證了H(z)
68、是穩(wěn)定的; (2) LSP參數具有相對獨立的性質;◆移動LSP參數中任一線譜頻率的位置,則頻譜只在該線譜頻率附近與原始譜有差異,在其他LSP頻率上變化很小?!暨@一特性有利于LSP參數的量化和內插。 (3) LSP參數反映聲道幅度譜的特點;◆ 在幅度大的地方分布較密,反之較疏。 反映出幅度譜中的共振峰特性。 (4) 相鄰幀LPC間有較強相關性,便于幀間參數的內插。 (5) 量化效率高。◆
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 語音信號的預測研究.pdf
- 語音編碼中的線性預測分析.pdf
- 基于dsp的語音信號編碼器
- 語音信號壓縮編碼原理及應用
- 語音信號的壓縮感知研究及其在語音編碼中的應用.pdf
- 語音信號混合激勵線線預測編碼的研究和實現.pdf
- 語音信號采集和分析報告
- 數字信號課程設計語音信號的采集、分析與處理
- 語音信號的數字化噪聲抑制技術
- 語音信號的小波分析.pdf
- 語音信號lpc分析的編程實現
- 數字信號處理課程設計---語音信號的頻譜分析
- 語音信號數字處理中語音編解碼算法的研究.pdf
- 碼激勵線性預測語音編碼的研究.pdf
- 語音信號矢量量化編碼技術研究.pdf
- 開題報告---語音信號處理
- 語音信號情感識別.pdf
- 基于CELP算法語音信號的編碼壓縮設計.pdf
- 探析語音信號的數字化噪聲抑制技術
- 語音信號采集系統設計
評論
0/150
提交評論