概述
12.4 多重共线性
12.4.1多重共线性及其所产生的问题
当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性(multicollinearity)。在实际问题中,所使用的自变量之间相关是一件很平常的事,但是在回归分析中存在多重共线性会导致某些问题。
首先,变量之间高度相关时,可能会使回归的结果混乱,甚至会把分析引入歧途。
其次,多重共线性可能对参数估计值的正负号产生影响,特别是
β
i
beta_i
βi的正负号有可能同预期的正负号相反。
12.4.2 多重共线性的判别
检测多重共线性的方法有多种,其中最简单的一种办法是计算模型中各对自变量之间的相关系数,并对各相关系数进行显著性检验。如果有一个或多个相关系数是显著的,就表示模型中所使用的自变量之间相关,因而存在多重共线性问题。
例12.4 沿用例12.1的数据,判别所建立的回归方程是否存在多重共线性
解:计算相关系数:
不良贷款(亿元) | 各项贷款余额(亿元) | 本年累计应收贷款(亿元) | 贷款项目个数(个) | |
---|---|---|---|---|
不良贷款(亿元) | 1 | |||
各项贷款余额(亿元) | 0.843571364 | 1 | ||
本年累计应收贷款(亿元) | 0.731505008 | 0.678771764 | 1 | |
贷款项目个数(个) | 0.700281491 | 0.848416404 | 0.58583149 | 1 |
本年固定资产投资额(亿元) | 0.51851809 | 0.779702158 | 0.47243096 | 0.746645845 |
计算检验统计量:
不良贷款(亿元) | 各项贷款余额(亿元) | 本年累计应收贷款(亿元) | 贷款项目个数(个) | |
---|---|---|---|---|
不良贷款(亿元) | 1 | |||
各项贷款余额(亿元) | 7.533514722 | 1 | ||
本年累计应收贷款(亿元) | 5.145188033 | 4.432870067 | 1 | |
贷款项目个数(个) | 4.704563881 | 7.686824493 | 3.466726451 | 1 |
本年固定资产投资额(亿元) | 2.908224028 | 5.971918465 | 2.570663005 | 5.382848133 |
t
α
/
2
(
25
−
2
)
=
2.06865761
t_{alpha/2}(25-2)=2.06865761
tα/2(25−2)=2.06865761,所有统计量都大于
t
α
/
2
(
25
−
2
)
=
2.06865761
t_{alpha/2}(25-2)=2.06865761
tα/2(25−2)=2.06865761,所以均拒绝,说明这4个变量两两之间有显著的相关关系
12.4.3 多重共线性问题的处理
(1)将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关。
(2)如果要在模型中保留所有的自变量那就应该:
- 避免根据t统计量对单个参数β进行检验。
- 对因变量y值的推断(估计或预测)限定在自变量样本值的范围内。
最后
以上就是糟糕蛋挞为你收集整理的第12章 多元线性回归-整理4的全部内容,希望文章能够帮你解决第12章 多元线性回归-整理4所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复