当前课程知识点:管理定量方法 >  第六章 相关与回归模型 >  第二十七节 多重共线性的诊断和修正(一) >  第二十七节 多重共线性的诊断和修正(一)

返回《管理定量方法》慕课在线视频课程列表

第二十七节 多重共线性的诊断和修正(一)在线视频

下一节:第二十八节 多重共线性的诊断和修正(二)

返回《管理定量方法》慕课在线视频列表

第二十七节 多重共线性的诊断和修正(一)课程教案、知识点、字幕

同学们 大家好

欢迎来到管理定量方法课程

我是今天的主讲老师 杨老师

第二十七讲

我们介绍

多重共线性诊断与修正的第一个部分

在这一部分

我们将给大家讨论两个非常重要的问题

一个问题是

多重共线性的定义及其诊断

第二 多重共线性的修正方法

首先我们讨论多重共线性的定义及其诊断

多重共线性是如何产生的

产生的背景和原因是什么

管理定量研究中

解释变量之间

完全不相关的情形

是非常少见的

尤其是研究某个经济问题的时候

涉及的解释变量比较多

我们很难找到一组解释变量

它们之间

互不相关

而且它们又对因变量

有显著的影响

客观地说

某个经济现象

涉及到多个影响因素的时候

多个影响因素之间

大都有一定的相关性

它们之间的相关性较弱时

我们一般

就认为

符合线性回归模型的基本要求

以下我们用一张巴伦坦图

来讨论

什么是多重共线性

可以看到第一张图

自变量X1

和X2

都和因变量Y之间有公共的部分

都对因变量Y产生了一个

线性的影响

但是X1

和X2之间的公共部分

比较少

像这一类的

线性回归模型

属于低度的多重共线性

是被允许的

如果出现图二的情型

X1和X2

与因变量Y之间有公共部分

对因变量Y都有一定的线性影响

但是最重要的是

X1和X2

作为自变量

自变量和自变量之间产生了大量的公共部分

它们之间非常的相关

这时候

线性回归模型出现了

高度的

多重共线性

是不被允许的

举例来说

研究我国居民的消费状况

影响居民消费状况的变量

有以下一些

比如职工的平均工资

农民的平均收入

银行利率

全国零售物价指数

国债利率

货币发行量

储蓄额

和前期的消费额等等

我们可以看到

如果以上的变量

作为自变量

讨论对我国居民消费状况的影响

这些自变量之间

会产生很强的相关性

下面我们给出

多重共线性的定义

对于回归模型Y

等于β0

加β1X1

加β2X2

一直加到βkXk

加随机误差项

我们有一个基本的假设

其自变量

或者是解释变量

X1 X2

一直到Xk

应该是相互独立的

如果某两个

或多个自变量

或者解释变量之间

出现了相关性

则称之为

多重共线性

实际的经济问题中

经常会出现多重共线性的现象

这里给大家简单做了一个总结

第一种情况

经济变量的

共同变化趋势

比如说

我们在经济建模的时候

采用了时间序列样本

经济繁荣时期

各个基本的经济变量

比如收入

消费 投资

价格等等

都趋于增长

而在衰退时期

这些变量

又同时趋于下降

在建模的过程中

如果我们使用的是

横截面数据

比如生产函数中

资本投入

与劳动力的投入

往往出现高度的相关

大企业二者都大

小企业二者都小

也就是时间序列样本

和横截面数据中

都有可能会出现

多重共线性

第二种情况

在我们

建模的时候

经常会引入一些

滞后的变量

在计量经济学模型中

往往需要引入滞后变量

来反映真实的经济关系

例如消费

就等于当期的收入

和前期收入的一个相关函数

显然两期收入

有较强的线性相关性

第三根据一般的经验进行判断

对于采用时间序列样本

以简单线性回归

建立计量经济模型

往往存在多重共线性

而且以截面数据

作为样本的时候

问题不那么严重

但多重共线性仍然是存在的

所以在管理定量研究方法中

共线性

是一个普遍存在的现象

如果回归模型

存在多重共线性

会对计量模型造成什么样的经济后果呢

第一 当自变量之间

存在着多重共线性的时候

用普通最小二乘法

OLS

对模型进行估计

仍然满足无偏性

但回归系数的方差会变大

减少估计的精度

在共线性存在情况下

虽然可以得到

普通最小二乘法

参数估计量

但参数估计的方差增大

普通最小二乘法

参数估计量的

非有效性增强

第二个经济后果是

参数估计量的

经济含义变得不合理

如果模型中

两个解释变量

具有线性的相关性

例如X1和X2

那么它们中的一个变量

可以由另一个变量所表征

X1

和X2的参数

并不反映各自

与被解释变量Y之间的结构关系

而是反映了

它们对被解释变量Y的共同影响

所以各自的参数

已经失去了应有的经济含义

于是经常表现出

似乎反常的一些经济现象

例如本来应该是正的

结果恰是相反的

第三

我们通过一张图

来说明

变量的显著性检验

将失去了一定的意义

如果回归模型中

存在着多重共线性

那么参数估计值的方差

与标准差

就会变大

使得t统计量的拒绝域变小

临界值增大

容易使通过样本计算的t值

小于临界值

误导做出参数为0的推断

结果可能会将

模型中重要的自变量

或者解释变量

排除在模型之外

第四 存在多重共线性的时候

会出现很多回归系数

统计检验不显著

但拟合优度却很高的情况

以至于

很难做出合理的

经济解释

直接影响到

最小二乘法的应用效果

降低了回归模型的

预测价值

如果多重共线性

会对模型产生重要的经济后果

那么多重共线性如何进行科学的诊断呢

我们给大家介绍

三种多重共线性的诊断方法

第一种

直接判断法

一般出现

如下的情况之一

可认为模型中

存在着多重共线性

第一拟合优度很大

但模型中

全部或部分参数统计

检验不显著

第二 当增加

或剔除一个自变量的时候

回归系数估计值

会发生较大的变化

第三 从定性分析得知

某个自变量

对因变量

有重要的影响

但此变量

回归系数

未通过统计检验

第四 有些自变量的回归系数符号

与定性分析不一致

第五 在自变量的相关系数矩阵中

简单相关系数较大

第六 一些重要的

自变量的回归系数的方差比较大

如果出现以上的一些基本情况

可以简单的判断

回归模型

是一定存在

多重共线性的

第二种方法

我们可以采用逐步回归法

逐步回归法

在后面我们会重点和大家

讨论模型的拟合过程

逐步回归法的

基本原理如下

以因变量Y

为解释变量

逐个引入解释变量X

构成回归模型

进行模型的估计

根据拟合优度R2的变化

决定新引入的变量

是否可以用

其他变量的线性组合来代替

而不作为独立的

解释变量

如果R2拟合优度变化显著

则说明

新引入的变量

是一个独立的解释变量

如果拟合优度变化

很不显著

则说明

新引入的变量

不是一个独立的解释变量

它可以用

其它的变量

线性组合来代替

也就是说

它与其它变量之间

存在着共线性的关系

第三种方法

我们可以用方差膨胀因子

来进行模型的共线性诊断

计算模型的

每一个自变量Xj

对于其余的解释变量X1

Xj-1

Xj+1

一直到Xk的辅助方程

并且由此计算出

其判断的系数

Rj的平方

可以构造一个

测度多重共线性的统计指标

方差膨胀因子

VIFJ

就等于

1-Rj的平方分之一

该指标称之为方差膨胀因子

如果解释变量Xj

与其余的解释变量

都不相关

则辅助方程的判定系数Rj的平方

等于0

其方差膨胀因子为1

说明解释变量之间

不存在多重共线性

如果其方差膨胀因子大于1

就意味着

该解释变量

与其它解释变量

有一定程度的相关性

即存在着多重共线性

一般来说

方差膨胀因子大于5

说明解释变量之间

存在着多重共线性是比较严重的

下面我们用IBM SPSS软件

帮助大家来计算

方差膨胀因子

对模型中的共线性

进行一个初步的诊断

我们打开一个

多元回归的分析数据

前面的课程我们已经

应用了这个数据来进行回归分析

因变量Y

是地区的销售额

自变量

分别是

销售的业务时间X1

总销售数量X2

广告费用X3

市场份额X4

和过去四年市场份额的变化X5

我们现在做一个多元回归

并诊断

其共线性

点分析

回归 线性回归

我们把

因变量Y

地区销售额

点入因变量

自变量的变量值

点入销售业务时间X1

总销售数量X2

广告费用X3

市场份额X4

和过去四年市场份额的变化X5

在进行线性回归的时候

如果想诊断

回归模型中的共线性

可以点统计

统计里边有一个功能键

共线性诊断

可以在这里边打勾

点continue继续

就可以进行共线性的诊断了

我们点确定

可以看到

回归模型中的摘要

摘要中

模型的R2

拟合优度

是92.3%

经调整之后的拟合优度

ADJUESTED R2

是90.3%

模型的估计标准误差

是409.73951

我们可以看到

模型的总检验

F值是45.495

p值是0.000

通过了总检验

在模型回归系数表里边

我们可以看到

原始的表格中

出现了

两列数据

一列数据

叫做容差

容差实际上

进行方差膨胀因子计算的过程中的

1-Rj的平方

1-Rj平方分之1

作一个倒数就得到了方差膨胀因子

5个自变量的方差膨胀因子

都是1点多

都没有超过标准5

所以可以看到

模型中的共线性

不是非常的严重

几乎是不存在共线性的

几乎没有共线性

所以模型的拟合效果

和总检验都通过了

模型的拟合效果良好

以上就是利用IBM SPSS软件

来进行共线性诊断的

基本过程

好 这节课我们就讲到这里

同学们再见

管理定量方法课程列表:

第一章 管理定量研究概述

-第一节 管理学研究概述

--第一节 管理学研究概述

-第二节 研究的有效性

--第二节 研究的有效性

-第一章 习题

--第一章 习题

第二章 定量数据的采集

-第三节 数据的采集(一)

--第三节 数据的采集(一)

-第四节 数据的采集(二)

--第四节 数据的采集(二)

-第五节 问卷与访谈

--第五节 问卷与访谈

-第二章 习题

--第二章 习题

第三章 测量与尺度设计

-第六节 变量的测量(一)

--第六节 变量的测量(一)

-第七节 变量的测量(二)

--第七节 变量的测量(二)

-第三章 习题

--第三章 习题

第四章 数据的描述与统计推断

-第八节 数据的描述

--第八节 数据的描述

-第九节 概率与随机变量(一)

--第九节 概率与随机变量(一)

-第十节 概率与随机变量(二)

--第十节 概率与随机变量(二)

-第十一节 抽样分布

--第十一节 抽样分布

-第十二节 参数估计

--第十二节 参数估计

-第十三节 假设检验(一)

--第十三节 假设检验(一)

-第十四节 假设检验(二)

--第十四节 假设检验(二)

-第四章 习题

--第四章 习题

第五章 多变量定量研究

-第十五节 问卷的结构效度——探索性因子分析(一)

--第十五节 问卷的结构效度——探索性因子分析(一)

-第十六节 问卷的结构效度——探索性因子分析(二)

--第十六节 问卷的结构效度——探索性因子分析(二)

-第十七节 聚类分析(一)

--第十七节 聚类分析(一)

-第十八节 聚类分析(二)

--第十八节 聚类分析(二)

-第五章 习题

--第五章 习题

第六章 相关与回归模型

-第十九节 相关和回归分析(一)

--第十九节 相关和回归分析(一)

-第二十节 相关和回归分析(二)

--第二十节 相关和回归分析(二)

-第二十一节 相关和回归分析(三)

--第二十一节 相关和回归分析(三)

-第二十二节 相关和回归分析(四)

--第二十二节 相关和回归分析(四)

-第二十三节 相关和回归分析(五)

--第二十三节 相关和回归分析(五)

-第二十四节 违背基本假设的回归(一)

--第二十四节 违背基本假设的回归(一)

-第二十五节 违背基本假设的回归(二)

--第二十五节 违背基本假设的回归(二)

-第二十六节 违背基本假设的回归(三)

--第二十六节 违背基本假设的回归(三)

-第二十七节 多重共线性的诊断和修正(一)

--第二十七节 多重共线性的诊断和修正(一)

-第二十八节 多重共线性的诊断和修正(二)

--第二十八节 多重共线性的诊断和修正(二)

-第六章 习题

--第六章 习题

第七章 定量方法总结与管理类硕士毕业论文指导

-第二十九节 硕士学位毕业论文指导(一)

--第二十九节 硕士学位毕业论文指导(一)

-第三十节 硕士学位毕业论文指导(二)

--第三十节 硕士学位毕业论文指导(二)

-第七章 习题

--第七章 习题

第二十七节 多重共线性的诊断和修正(一)笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。