当前课程知识点:管理定量方法 > 第六章 相关与回归模型 > 第二十七节 多重共线性的诊断和修正(一) > 第二十七节 多重共线性的诊断和修正(一)
同学们 大家好
欢迎来到管理定量方法课程
我是今天的主讲老师 杨老师
第二十七讲
我们介绍
多重共线性诊断与修正的第一个部分
在这一部分
我们将给大家讨论两个非常重要的问题
一个问题是
多重共线性的定义及其诊断
第二 多重共线性的修正方法
首先我们讨论多重共线性的定义及其诊断
多重共线性是如何产生的
产生的背景和原因是什么
管理定量研究中
解释变量之间
完全不相关的情形
是非常少见的
尤其是研究某个经济问题的时候
涉及的解释变量比较多
我们很难找到一组解释变量
它们之间
互不相关
而且它们又对因变量
有显著的影响
客观地说
某个经济现象
涉及到多个影响因素的时候
多个影响因素之间
大都有一定的相关性
它们之间的相关性较弱时
我们一般
就认为
符合线性回归模型的基本要求
以下我们用一张巴伦坦图
来讨论
什么是多重共线性
可以看到第一张图
自变量X1
和X2
都和因变量Y之间有公共的部分
都对因变量Y产生了一个
线性的影响
但是X1
和X2之间的公共部分
比较少
像这一类的
线性回归模型
属于低度的多重共线性
是被允许的
如果出现图二的情型
X1和X2
与因变量Y之间有公共部分
对因变量Y都有一定的线性影响
但是最重要的是
X1和X2
作为自变量
自变量和自变量之间产生了大量的公共部分
它们之间非常的相关
这时候
线性回归模型出现了
高度的
多重共线性
是不被允许的
举例来说
研究我国居民的消费状况
影响居民消费状况的变量
有以下一些
比如职工的平均工资
农民的平均收入
银行利率
全国零售物价指数
国债利率
货币发行量
储蓄额
和前期的消费额等等
我们可以看到
如果以上的变量
作为自变量
讨论对我国居民消费状况的影响
这些自变量之间
会产生很强的相关性
下面我们给出
多重共线性的定义
对于回归模型Y
等于β0
加β1X1
加β2X2
一直加到βkXk
加随机误差项
我们有一个基本的假设
其自变量
或者是解释变量
X1 X2
一直到Xk
应该是相互独立的
如果某两个
或多个自变量
或者解释变量之间
出现了相关性
则称之为
多重共线性
实际的经济问题中
经常会出现多重共线性的现象
这里给大家简单做了一个总结
第一种情况
经济变量的
共同变化趋势
比如说
我们在经济建模的时候
采用了时间序列样本
经济繁荣时期
各个基本的经济变量
比如收入
消费 投资
价格等等
都趋于增长
而在衰退时期
这些变量
又同时趋于下降
在建模的过程中
如果我们使用的是
横截面数据
比如生产函数中
资本投入
与劳动力的投入
往往出现高度的相关
大企业二者都大
小企业二者都小
也就是时间序列样本
和横截面数据中
都有可能会出现
多重共线性
第二种情况
在我们
建模的时候
经常会引入一些
滞后的变量
在计量经济学模型中
往往需要引入滞后变量
来反映真实的经济关系
例如消费
就等于当期的收入
和前期收入的一个相关函数
显然两期收入
有较强的线性相关性
第三根据一般的经验进行判断
对于采用时间序列样本
以简单线性回归
建立计量经济模型
往往存在多重共线性
而且以截面数据
作为样本的时候
问题不那么严重
但多重共线性仍然是存在的
所以在管理定量研究方法中
共线性
是一个普遍存在的现象
如果回归模型
存在多重共线性
会对计量模型造成什么样的经济后果呢
第一 当自变量之间
存在着多重共线性的时候
用普通最小二乘法
OLS
对模型进行估计
仍然满足无偏性
但回归系数的方差会变大
减少估计的精度
在共线性存在情况下
虽然可以得到
普通最小二乘法
参数估计量
但参数估计的方差增大
普通最小二乘法
参数估计量的
非有效性增强
第二个经济后果是
参数估计量的
经济含义变得不合理
如果模型中
两个解释变量
具有线性的相关性
例如X1和X2
那么它们中的一个变量
可以由另一个变量所表征
X1
和X2的参数
并不反映各自
与被解释变量Y之间的结构关系
而是反映了
它们对被解释变量Y的共同影响
所以各自的参数
已经失去了应有的经济含义
于是经常表现出
似乎反常的一些经济现象
例如本来应该是正的
结果恰是相反的
第三
我们通过一张图
来说明
变量的显著性检验
将失去了一定的意义
如果回归模型中
存在着多重共线性
那么参数估计值的方差
与标准差
就会变大
使得t统计量的拒绝域变小
临界值增大
容易使通过样本计算的t值
小于临界值
误导做出参数为0的推断
结果可能会将
模型中重要的自变量
或者解释变量
排除在模型之外
第四 存在多重共线性的时候
会出现很多回归系数
统计检验不显著
但拟合优度却很高的情况
以至于
很难做出合理的
经济解释
直接影响到
最小二乘法的应用效果
降低了回归模型的
预测价值
如果多重共线性
会对模型产生重要的经济后果
那么多重共线性如何进行科学的诊断呢
我们给大家介绍
三种多重共线性的诊断方法
第一种
直接判断法
一般出现
如下的情况之一
可认为模型中
存在着多重共线性
第一拟合优度很大
但模型中
全部或部分参数统计
检验不显著
第二 当增加
或剔除一个自变量的时候
回归系数估计值
会发生较大的变化
第三 从定性分析得知
某个自变量
对因变量
有重要的影响
但此变量
回归系数
未通过统计检验
第四 有些自变量的回归系数符号
与定性分析不一致
第五 在自变量的相关系数矩阵中
简单相关系数较大
第六 一些重要的
自变量的回归系数的方差比较大
如果出现以上的一些基本情况
可以简单的判断
回归模型
是一定存在
多重共线性的
第二种方法
我们可以采用逐步回归法
逐步回归法
在后面我们会重点和大家
讨论模型的拟合过程
逐步回归法的
基本原理如下
以因变量Y
为解释变量
逐个引入解释变量X
构成回归模型
进行模型的估计
根据拟合优度R2的变化
决定新引入的变量
是否可以用
其他变量的线性组合来代替
而不作为独立的
解释变量
如果R2拟合优度变化显著
则说明
新引入的变量
是一个独立的解释变量
如果拟合优度变化
很不显著
则说明
新引入的变量
不是一个独立的解释变量
它可以用
其它的变量
线性组合来代替
也就是说
它与其它变量之间
存在着共线性的关系
第三种方法
我们可以用方差膨胀因子
来进行模型的共线性诊断
计算模型的
每一个自变量Xj
对于其余的解释变量X1
Xj-1
Xj+1
一直到Xk的辅助方程
并且由此计算出
其判断的系数
Rj的平方
可以构造一个
测度多重共线性的统计指标
方差膨胀因子
VIFJ
就等于
1-Rj的平方分之一
该指标称之为方差膨胀因子
如果解释变量Xj
与其余的解释变量
都不相关
则辅助方程的判定系数Rj的平方
等于0
其方差膨胀因子为1
说明解释变量之间
不存在多重共线性
如果其方差膨胀因子大于1
就意味着
该解释变量
与其它解释变量
有一定程度的相关性
即存在着多重共线性
一般来说
方差膨胀因子大于5
说明解释变量之间
存在着多重共线性是比较严重的
下面我们用IBM SPSS软件
帮助大家来计算
方差膨胀因子
对模型中的共线性
进行一个初步的诊断
我们打开一个
多元回归的分析数据
前面的课程我们已经
应用了这个数据来进行回归分析
因变量Y
是地区的销售额
自变量
分别是
销售的业务时间X1
总销售数量X2
广告费用X3
市场份额X4
和过去四年市场份额的变化X5
我们现在做一个多元回归
并诊断
其共线性
点分析
回归 线性回归
我们把
因变量Y
地区销售额
点入因变量
自变量的变量值
点入销售业务时间X1
总销售数量X2
广告费用X3
市场份额X4
和过去四年市场份额的变化X5
在进行线性回归的时候
如果想诊断
回归模型中的共线性
可以点统计
统计里边有一个功能键
共线性诊断
可以在这里边打勾
点continue继续
就可以进行共线性的诊断了
我们点确定
可以看到
回归模型中的摘要
摘要中
模型的R2
拟合优度
是92.3%
经调整之后的拟合优度
ADJUESTED R2
是90.3%
模型的估计标准误差
是409.73951
我们可以看到
模型的总检验
F值是45.495
p值是0.000
通过了总检验
在模型回归系数表里边
我们可以看到
原始的表格中
出现了
两列数据
一列数据
叫做容差
容差实际上
进行方差膨胀因子计算的过程中的
1-Rj的平方
1-Rj平方分之1
作一个倒数就得到了方差膨胀因子
5个自变量的方差膨胀因子
都是1点多
都没有超过标准5
所以可以看到
模型中的共线性
不是非常的严重
几乎是不存在共线性的
几乎没有共线性
所以模型的拟合效果
和总检验都通过了
模型的拟合效果良好
以上就是利用IBM SPSS软件
来进行共线性诊断的
基本过程
好 这节课我们就讲到这里
同学们再见
-第一节 管理学研究概述
-第二节 研究的有效性
-第一章 习题
--第一章 习题
-第三节 数据的采集(一)
-第四节 数据的采集(二)
-第五节 问卷与访谈
-第二章 习题
--第二章 习题
-第六节 变量的测量(一)
-第七节 变量的测量(二)
-第三章 习题
--第三章 习题
-第八节 数据的描述
-第九节 概率与随机变量(一)
-第十节 概率与随机变量(二)
-第十一节 抽样分布
-第十二节 参数估计
-第十三节 假设检验(一)
-第十四节 假设检验(二)
-第四章 习题
--第四章 习题
-第十五节 问卷的结构效度——探索性因子分析(一)
-第十六节 问卷的结构效度——探索性因子分析(二)
-第十七节 聚类分析(一)
-第十八节 聚类分析(二)
-第五章 习题
--第五章 习题
-第十九节 相关和回归分析(一)
-第二十节 相关和回归分析(二)
-第二十一节 相关和回归分析(三)
-第二十二节 相关和回归分析(四)
-第二十三节 相关和回归分析(五)
-第二十四节 违背基本假设的回归(一)
-第二十五节 违背基本假设的回归(二)
-第二十六节 违背基本假设的回归(三)
-第二十七节 多重共线性的诊断和修正(一)
-第二十八节 多重共线性的诊断和修正(二)
-第六章 习题
--第六章 习题
-第二十九节 硕士学位毕业论文指导(一)
-第三十节 硕士学位毕业论文指导(二)
-第七章 习题
--第七章 习题