大師兄的應用回歸分析學習筆記(十七):多重共線性的情形及其處理(二)

大師兄的應用回歸分析學習筆記(十六):多重共線性的情形及其處理(一)
大師兄的應用回歸分析學習筆記(十八):多重共線性的情形及其處理(三)

三、多重共線性的診斷

  • 一般情況下,回歸方程的解釋變量之間存在很強的線性關系,回歸方程的檢驗高度顯著時,有些與因變量y的簡單相關系數絕對值很大的自變量,其回歸系數不能通過顯著性檢測,甚至有的回歸系數所帶符號與實際經濟意義不符,這時就認為存在多重共線性。
  • 集中主要方法如下:
1. 方差擴大因子法
  • 對自變量做中心標準化,則X^{*'}X^*為自變量的相關陣,記C=(C_{ij})=(X^{*'}X^*)^{-1},稱其主對角線元素VIF_j=c_{jj}為自變量x_j的方差擴大因子(variance inflation factor, VIF), 可知var(\hat\beta_j)=C_{jj}\delta^2/L_{jj},j=1,2,...,p
  • 式中L_{jj}x_j的離差平方和
  • C_{jj}作為衡量自變量x_j的方差擴大程度的因子是恰如其分的
  • R^2_j為自變量x_j對其余p-1個自變量的復決定系數,可以證明c_{jj}=\frac{1}{1-R^2_j}
  • R^2_j度量了自變量x_j與其余p-1個自變量的線性相關程度,這種相關程度越強,說明自變量之間的多重共線性越嚴重,R^2_j越接近1,VIF_j就越大。
  • 相反,x_j與其余p-1個自變量的線性相關程度越弱,自變量間的多重共線性就越弱,R^2_j就越接近0,VIF就越接近1.
  • 經驗表明,當VIF \geq10時,說明變量x_j與其余自變量之間有嚴重的多重共線性,且這種多重共線性可能會過度地影響最小二乘估計。
  • 也可以用p個自變量所對應的方差擴大因子的平均數來度量多重共線性,當\overline {VIF}=\frac{1}{p}\sum^p_{i=1}VIF_j遠遠大于1時,就表現存在嚴重的多重共線性問題。
  • 對于只含兩個解釋變量x_1,x_2的回歸方程,計算x_1,x_2的決定系數R^2_{12}就是判斷它們是否存在多重共線性:
  • 如果R^2很大,則認為x_1,x_2可能存在嚴重的多重共線性
  • R^2和樣本量n有關,當樣本量較小時,R^2容易接近1
  • 所以當樣本量不算小,而且R^2接近1時,可以肯定存在嚴重的多重共線性
2. 特征根判定法
2.1 特征根分析
  • 根據矩陣行列式的性質,矩陣的行列式等于其特征根的連乘積。
  • 因而,當行列式|X'X|\approx 0時,矩陣X'X至少有一個特征根近似為零。
  • 反之可以證明,當矩陣X'X至少有一個特征根近似為零時,X的列向量間必然存在多重共線性。
  • 如果矩陣X'X有多個特征根近似為零,取每個特征根的特征向量為標準化正交向量,即可證明X'X有多個特征根近似零,X就有多少個多重共線性關系。
2.1 條件數
  • 特征根分析表明,當矩陣X'X有一個特征根近似為零時,設計矩陣X的列向量間必然存在多重共線性,并且X'X有多少個特征接近零,X就有多少個多重共線性關系。
  • 特征根近似為零的標準用下面方法界定:記X'X的最大特征根為\lambda_mk_i=\sqrt{\frac{\lambda_m}{\lambda_i}},i=0,1,2,...,p為特征根的條件數(condition index)
  • 條件數度量了矩陣X'X的特征根的散布程度,可以用來判斷多重共線性是否存在以及多重共線性的嚴重程度:
  • 通常認為0<k<10時,設計矩陣X沒有多重共線性
  • 10\leq k<100時,存在較強的多重共線性;
  • k\geq 100時,存在嚴重的多重共線性。
  • 計算出特征根與條件數輸出結果:


  • 從條件數看到,最大的兩個條件數k_6=116.995,k_5=101.639
  • 說明自變量間存在嚴重的多重共線性。
  • 可以由條件數表中右邊的方差比例粗略判定哪幾個自閉那輛間存在共線性,如果有某幾個自變量的方差比例值在某一行同時較大(接近1),則這幾個自閉間就存在多重共線性。
  • 從第6行看,x_5對應的0.91方差比例0.91最大,說明x_5與x_1,x_2,x_3,x_4之間存在強的付共線性。
  • 第5行常數項方差比例0.96最大,x_5對應的方差比例0最小,其他變量的方差比例再0.11~0.39之間,說明x_1,x_2,x_3,x_4之間存在一個線性組合約等于常數。
  • 但是方差比例并不直接是共線性關系的系數,方差比例是根據特征向量計算的,計算方法是:
  • 在求特征根和特征向量時數據要標準化,以消除量綱的影響。
  • 由于設計矩陣X的第一列有一列1,所以在標準化時變量不能減去均值,而是直接除以每列數據平方和的平方根。
  • 包括每一列1也做同樣的變換,得標準化的設計矩陣X',其中每列都是單位列向量,列平方和等于1,然后再對X'X求特征根和特征向量。
3.直觀判定法
  • 方差擴大因子和條件數方法給出了識別多重共線性的數量標準
  • 需要注意的是,這種數量標準并不是識別多重共線性的絕對標準,還應該結合一些直觀方法綜合識別多重共線性。
  • 當出現與因變量y的簡單相關系數絕對值很大的自變量,但是其偏回歸系數不能通過顯著性檢驗,檢驗,甚至出現回歸系數符號與實際經濟意義相反的情況時,就認為存在多重共線性。
  • 直管判斷綜述如下
  • 當增加或剔除一個自變量,其他自變量的回歸系數的估計值或顯著性發生較大變化時,認為回歸方程存在嚴重的多重共線性。
  • 當定性分析認為一些重要的自變量在回歸方程中沒有通過顯著性檢驗時,可初步判斷存在嚴重的多重共線性。
  • 當與因變量之間的簡單相關系數絕對值很大的自變量在回歸方程中沒有通過顯著性檢驗時,可初步判斷存在嚴重的多重共線性。
  • 當有些自變量的回歸系數的數值大小與預期相差很大,甚至正負號與定性分析結果相反時,存在嚴重的多重共線性問題。
  • 在自變量的相關矩陣中,當自變量間的相關系數較大時會出現多重共線性問題。
  • 當一些重要的自變量的回歸系數的標準誤差較大時,可能存在多重共線性。
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,197評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,415評論 3 415
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,104評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,884評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,647評論 6 408
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,130評論 1 323
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,208評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,366評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,887評論 1 334
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,737評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,939評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,478評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,174評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,586評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,827評論 1 283
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,608評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,914評論 2 372

推薦閱讀更多精彩內容