《計(jì)量經(jīng)濟(jì)學(xué)》第4章.多重共線性_第1頁
已閱讀1頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章 多重共線性Multi-Collinearity,計(jì)量經(jīng)濟(jì)學(xué),引子:國內(nèi)生產(chǎn)總值增加會(huì)減少財(cái)政收入嗎?,為了分析各主要因素對國家財(cái)政收入的影響,建立財(cái)政收入(億元) (CZSR)為被解釋變量,財(cái)政支出(億元)(CZZC)、國內(nèi)生產(chǎn)總值(億元)(GDP)、稅收總額(億元)(SSZE)等為解釋變量的計(jì)量模型。數(shù)據(jù)樣本時(shí)期:1978年-2011年的統(tǒng)計(jì)數(shù)據(jù)。設(shè)定的理論模型為: 采用普通最小二乘法得到以下估計(jì)結(jié)果,

2、,,財(cái)政收入模型的EViews估計(jì)結(jié)果,●可決系數(shù)為0.99979 ,校正的可決系數(shù)為0.99977,模型擬合很好。模型對財(cái)政收入的解釋程度高達(dá)99.9%。 ●F統(tǒng)計(jì)量為47897.29,說明0.05水平下回歸方程整體上很顯著。 ● t 檢驗(yàn)結(jié)果表明,各個(gè)解釋變量對財(cái)政收入的影響均顯著,但是國內(nèi)生產(chǎn)總值對財(cái)政收入的回歸系數(shù)的符號(hào)為負(fù),即經(jīng)濟(jì)增長反而會(huì)使財(cái)政收入減少。這顯然與理論分析和實(shí)踐經(jīng)驗(yàn)不相符。為什么會(huì)出現(xiàn)這樣的異常結(jié)果?如

3、果模型設(shè)定和數(shù)據(jù)真實(shí)性沒問題,問題會(huì)出在哪里呢?,模型估計(jì)與檢驗(yàn)結(jié)果分析,第四章 多重共線性,本章討論五個(gè)問題: ●什么是多重共線性 ●多重共線性的經(jīng)濟(jì)背景 ●多重共線性產(chǎn)生的后果 ●多重共線性的檢驗(yàn) ●多重共線性的補(bǔ)救措施,一、多重共線性的含義,或者說, 時(shí),表明在數(shù)據(jù)矩陣 中,至少有一個(gè)列向量可以用其余的列向量線性表示,則說明存在完全的多重共線性。,對于解釋變量

4、 ,如果存在不全為0的數(shù) ,使得則稱解釋變量 之間存在著完全的多重共線性,完全的多重共線性,不完全的多重共線性,,,解釋變量間毫無線性關(guān)系,變量間相互正交。這時(shí)已不需要作多元回歸,每個(gè)參數(shù)?j都可以通過Y 對 Xj 的一元回歸來估計(jì)。,二、產(chǎn)生多重共線性的背景,多重共線性產(chǎn)生的經(jīng)濟(jì)背景主要有幾種情形: 1.經(jīng)濟(jì)變量之間具有共同變化趨勢。 時(shí)間序列數(shù)據(jù):經(jīng)

5、濟(jì)繁榮時(shí)期,各基本經(jīng)濟(jì)變量(收入、消費(fèi)、投資、價(jià)格)都趨于增長;衰退時(shí)期,又同時(shí)趨于下降 橫截面數(shù)據(jù):變量變化與發(fā)展規(guī)模有關(guān),例如在生產(chǎn)函數(shù)中,資本投入與勞動(dòng)力投入往往出現(xiàn)高度相關(guān)情況,大企業(yè)二者都大,小企業(yè)都小 2.模型中包含滯后變量。 例如,消費(fèi)=f(當(dāng)期收入, 前期收入) 3.樣本數(shù)據(jù)自身的原因。 抽樣取值有限,三、 多重共線性產(chǎn)生的后果,如果存在完全共線性,則(X’X)-1不存在,無法得到唯一的參數(shù)

6、估計(jì)量。,1、完全共線性下參數(shù)估計(jì)量無意義,OLS估計(jì)量為:,X1和X2前的參數(shù)?1、?2并不反映各自與被解釋變量之間的結(jié)構(gòu)關(guān)系,而是反映它們對被解釋變量的共同影響。?1、?2已經(jīng)失去了應(yīng)有的經(jīng)濟(jì)含義,于是經(jīng)常表現(xiàn)出似乎反常的現(xiàn)象:例如?1本來應(yīng)該是正的,結(jié)果恰是負(fù)的。,這時(shí),實(shí)際只能確定綜合參數(shù)?1+??2的估計(jì)值,近似共線性下,可以得到OLS參數(shù)估計(jì)量, 但參數(shù)估計(jì)量方差的表達(dá)式為,由于|X’X|?0,引起(X’X) -1

7、主對角線元素較大,使參數(shù)估計(jì)值的方差增大,OLS參數(shù)估計(jì)量非有效,亦會(huì)使變量的顯著性檢驗(yàn)和預(yù)測檢驗(yàn)失去意義,2、不完全共線性下估計(jì)量方差偏大,四、多重共線性的檢驗(yàn),本節(jié)基本內(nèi)容: ● 簡單相關(guān)系數(shù)檢驗(yàn)法 ● 方差擴(kuò)大(膨脹)因子法 ● 直觀判斷法 ● 逐步回歸法,兩個(gè)問題(1)是否存在(2)哪些變量存在?,1、簡單相關(guān)系數(shù)檢驗(yàn)法,判斷規(guī)則:一般而言,如果每兩個(gè)解釋變量的簡單相關(guān)系數(shù)(零階相關(guān)系數(shù))比較高,例如

8、大于0.8,則可認(rèn)為存在著較嚴(yán)重的多重共線性。,計(jì)算解釋變量之間的相關(guān)系數(shù)或相關(guān)矩陣,注意:較高的簡單相關(guān)系數(shù)只是多重共線性存在的充分條件,而不是必要條件,2、方差擴(kuò)大(膨脹)因子法,統(tǒng)計(jì)上可以證明,,的方差可表示為,(Variance Inflation Factor),即,,其中 是Xj關(guān)于其余解釋變量的輔助回歸的可決系數(shù),經(jīng)驗(yàn)規(guī)則,●方差膨脹因子越大,表明解釋變量之間的多重共性越嚴(yán)重。反過來,方差膨脹因子越接近于

9、1,多重共線性越弱?!窠?jīng)驗(yàn)表明,方差膨脹因子≥10時(shí),說明解釋變量與其余解釋變量之間有嚴(yán)重的多重共線性,且這種多重共線性可能會(huì)過度地影響最小二乘估計(jì)。,3、直觀判斷法,1. 當(dāng)增加或剔除一個(gè)解釋變量,或者改變一個(gè)觀測值時(shí),回歸參數(shù)的估計(jì)值發(fā)生較大變化2. 一些重要的解釋變量的回歸系數(shù)的標(biāo)準(zhǔn)誤差較大,在回歸方程中沒有通過顯著性檢驗(yàn)時(shí)3. 有些解釋變量的回歸系數(shù)所帶正負(fù)號(hào)與定性分析結(jié)果違背時(shí)4. 模型的可決系數(shù)較高,F(xiàn)檢驗(yàn)顯著,回歸

10、系數(shù)的方差較大,t值較小,即在統(tǒng)計(jì)上均不顯著。,根據(jù)經(jīng)驗(yàn),通常以下情況的出現(xiàn)可能是由于存在多重共線性,4、逐步回歸檢測法,逐步回歸的基本思想 將變量逐個(gè)的引入模型,每引入一個(gè)解釋變量后,都要進(jìn)行F檢驗(yàn),并對已經(jīng)選入的解釋變量逐個(gè)進(jìn)行t 檢驗(yàn),當(dāng)原來引入的解釋變量由于后面解釋變量的引入而變得不再顯著時(shí),則將其剔除。以確保每次引入新的變量之前回歸方程中只包含顯著的變量。 在逐步回歸中,高度相關(guān)的解釋變量,在引入時(shí)會(huì)被剔除。因而也

11、是一種檢測多重共線性的有效方法。,五、 多重共線性的補(bǔ)救措施,本節(jié)基本內(nèi)容: ●修正多重共線性的經(jīng)驗(yàn)方法 ●逐步回歸法,1、修正多重共線性的經(jīng)驗(yàn)方法,(1). 剔除變量法把方差擴(kuò)大因子最大者所對應(yīng)的自變量首先剔除再重新建立回歸方程,直至回歸方程中不再存在嚴(yán)重的多重共線性。注意: 若剔除了重要變量,可能引起模型的設(shè)定誤差。,(2). 增大樣本容量如果樣本容量增加,會(huì)減小回歸參數(shù)的方差,標(biāo)準(zhǔn)誤差也同樣會(huì)減小。因此

12、盡可能地收集足夠多的樣本數(shù)據(jù)可以改進(jìn)模型參數(shù)的估計(jì)。問題:增加樣本數(shù)據(jù)在實(shí)際計(jì)量分析中常面臨許多困難。,(3). 變換模型形式(一般適用于時(shí)間序列數(shù)據(jù))一般而言,差分后變量之間的相關(guān)性要比差分前弱得多,所以差分后的模型可能降低出現(xiàn)共線性的可能性,此時(shí)可直接估計(jì)差分方程。問題:差分會(huì)丟失一些信息,差分模型的誤差項(xiàng)可能存在序列相關(guān),可能會(huì)違背經(jīng)典線性回歸模型的相關(guān)假設(shè),在具體運(yùn)用時(shí)要慎重。,(4). 利用非樣本先驗(yàn)信息通

13、過經(jīng)濟(jì)理論分析能夠得到某些參數(shù)之間的關(guān)系,可以將這種關(guān)系作為約束條件,將此約束條件和樣本信息結(jié)合起來進(jìn)行約束最小二乘估計(jì)。,(5). 橫截面數(shù)據(jù)與時(shí)序數(shù)據(jù)并用首先利用橫截面數(shù)據(jù)估計(jì)出部分參數(shù),再利用時(shí)序數(shù)據(jù)估計(jì)出另外的部分參數(shù),最后得到整個(gè)方程參數(shù)的估計(jì)。 注意:這里包含著假設(shè),即參數(shù)的橫截面估計(jì)和從純粹時(shí)間序列分析中得到的估計(jì)是一樣的。,(6). 變量變換變量變換的主要方法:(1)計(jì)算相對指標(biāo) (2)將名義數(shù)據(jù)轉(zhuǎn)換

14、為實(shí)際數(shù)據(jù) (3)將小類指標(biāo)合并成大類指標(biāo) (4)對數(shù)變換變量數(shù)據(jù)的變換有時(shí)可得到較好的結(jié)果,但無法保證一定可以得到很好的結(jié)果。,2、逐步回歸法,(1)用被解釋變量對每一個(gè)所考慮的解釋變量做簡單回歸。(2)以對被解釋變量貢獻(xiàn)最大的解釋變量所對應(yīng)的回歸方程為基礎(chǔ),按對被解釋變量貢獻(xiàn)大小的順序逐個(gè)引入其余的解釋變量。(a)若新變量的引入改進(jìn)了 和 檢驗(yàn),且回歸參數(shù)的t 檢驗(yàn)在統(tǒng)計(jì)上也是顯著的,則在模型中保留該變量。,

15、(b)若新變量的引入未能改進(jìn) 和 檢驗(yàn),且對其他回歸參數(shù)估計(jì)值的t 檢驗(yàn)也未帶來什么影響,則認(rèn)為該變量是多余變量。(c)若新變量的引入未能改進(jìn) 和 檢驗(yàn),且顯著地影響了其他回歸參數(shù)估計(jì)值的數(shù)值或符號(hào),同時(shí)本身的回歸參數(shù)也通不過t 檢驗(yàn),說明出現(xiàn)了嚴(yán)重的多重共線性。 (d)已被引入回歸方程的變量在引入新變量后,也可能失去重要性而被剔除。,六、案例分析,一、研究的目的要求提出研究的問題——為了規(guī)劃中國未來國內(nèi)旅游產(chǎn)業(yè)

16、的發(fā)展,需要定量地分析影響中國國內(nèi)旅游市場發(fā)展的主要因素。二、模型設(shè)定及其估計(jì)影響因素分析與確定——影響因素主要有國內(nèi)旅游人數(shù) ,城鎮(zhèn)居民人均旅游支出 ,農(nóng)村居民人均旅游支出 ,并以鐵路里程 作為相關(guān)基礎(chǔ)設(shè)施的代表 理論模型的設(shè)定其中 : ——第 t 年全國國內(nèi)旅游收入,,,,,,,,數(shù)據(jù)的收集與處理,1994年—2011年中國旅游收入及相關(guān)數(shù)據(jù),該模型,,,可決系數(shù)較高,F(xiàn)檢驗(yàn)值225.85,明

17、顯顯著。但是當(dāng),時(shí),、,,OLS 估計(jì)的結(jié)果,,,,,,,不僅X5的系數(shù)不顯著,而且X3、X5的符號(hào)與預(yù)期相反,這表明可能存在嚴(yán)重的多重共線性。,計(jì)算各解釋變量的相關(guān)系數(shù),表明各解釋變量間確實(shí)存在嚴(yán)重的線性關(guān)系,將每個(gè)解釋變量分別作為被解釋變量對其余的解釋變量進(jìn)行輔助回歸,回歸所得到的可決系數(shù)和方差擴(kuò)大因子的數(shù)值見下表。,,經(jīng)驗(yàn)表明,方差擴(kuò)大因子 VIFj ≥ 10時(shí),通常說明該解釋變量與其余解釋變量之間有嚴(yán)重的多重共線性,這里X2、

18、X5的方差擴(kuò)大因子遠(yuǎn)大于10,表明存在嚴(yán)重多重共線性問題。,三、消除多重共線性,將各變量進(jìn)行對數(shù)變換,再對以下模型進(jìn)行估計(jì),,,,結(jié)果:1.可決系數(shù)很高2.F檢驗(yàn)顯著性高3.系數(shù)都顯著4.所有解釋變量的符號(hào)都與實(shí)際意義相符,最后消除多重共線性的結(jié)果,四、回歸結(jié)果的解釋與分析,,,,,,,,,,該模型 ,可決系數(shù)很高,F(xiàn)檢驗(yàn)值1540.78,明顯顯著。

19、 所有系數(shù)估計(jì)值高度顯著。,,另一案例——中國糧食生產(chǎn)函數(shù),根據(jù)理論和經(jīng)驗(yàn)分析,影響糧食生產(chǎn)(Y)的主要因素有: 農(nóng)業(yè)化肥施用量(X1);糧食播種面積(X2) 成災(zāi)面積(X3); 農(nóng)業(yè)機(jī)械總動(dòng)力(X4); 農(nóng)業(yè)勞動(dòng)力(X5),已知中國糧食生產(chǎn)的相關(guān)數(shù)據(jù),建立中國糧食生產(chǎn)函數(shù): Y=?0+?1 X1 +?2 X2 +?3

20、X3 +?4 X4 +?4 X5 +u,1、用OLS法估計(jì)上述模型:,R2接近于1; 給定?=5%,得F臨界值 F0.05(5,12)=3.11 F=638.4 > 15.19,故認(rèn)上述糧食生產(chǎn)的總體線性關(guān)系顯著成立。 但X4 、X5 的參數(shù)未通過t檢驗(yàn),且符號(hào)不正確,故解釋變量間可能存在多重共線性。,(-0.91) (8.39) (3.32) (-2.81)

21、 (-1.45) (-0.14),2、檢驗(yàn)簡單相關(guān)系數(shù),發(fā)現(xiàn): X1與X4間存在高度相關(guān)性。,列出X1,X2,X3,X4,X5的相關(guān)系數(shù)矩陣:,3、找出最簡單的回歸形式,可見,應(yīng)選第1個(gè)式子為初始的回歸模型。,分別作Y與X1,X2,X3,X4,X5間的回歸:,(25.58) (11.49) R2=0.8919 F=132.1 DW=1.56,(-0.49) (1.14) R2

22、=0.075 F=1.30 DW=0.12,(17.45) (6.68) R2=0.7527 F=48.7 DW=1.11,(-1.04) (2.66)R2=0.3064 F=7.07 DW=0.36,4、逐步回歸,將其他解釋變量分別導(dǎo)入上述初始回歸模型,尋找最佳回歸方程。,回歸方程以Y=f(X1,X2,X3)為最優(yōu):,5、結(jié)論,第四章 小結(jié),1.多重共線性是指各個(gè)解釋變量

23、之間有準(zhǔn)確或近似準(zhǔn)確的線性關(guān)系。2.多重共線性的后果: 如果各個(gè)解釋變量之間有完全的共線性,則它們的 回歸系數(shù)是不確定的,并且它們的方差會(huì)無窮大。 如果共線性是高度的但不完全的,回歸系數(shù)可估計(jì), 但有較大的標(biāo)準(zhǔn)誤差?;貧w系數(shù)不能準(zhǔn)確地估計(jì)。,3.診斷共線性的經(jīng)驗(yàn)方法: (1) 表現(xiàn)為可決系數(shù)異常高而回歸系數(shù)的t 檢驗(yàn)不顯著。 (2) 變量之間簡單相關(guān)系數(shù)。多個(gè)解釋變量時(shí),較低的零階相關(guān)也可能出現(xiàn)多重共線性,需

24、要檢查偏相關(guān)系數(shù)。 (4)如果 高而偏相關(guān)系數(shù)低,則多重共線性是可能的。 (5) 用解釋變量間輔助回歸的可決系數(shù)判斷。,4.降低多重共線性的經(jīng)驗(yàn)方法: (1)利用外部或先驗(yàn)信息; (2)橫截面與時(shí)間序列數(shù)據(jù)并用; (3)剔除高度共線性的變量(如逐步回歸); (4)數(shù)據(jù)轉(zhuǎn)換; (5)獲取補(bǔ)充數(shù)據(jù)或新數(shù)據(jù); (6)選擇有偏估計(jì)量(如嶺回歸)。 經(jīng)驗(yàn)方法的效果取決于數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論