当前课程知识点:管理定量方法 > 第六章 相关与回归模型 > 第二十二节 相关和回归分析(四) > 第二十二节 相关和回归分析(四)
同学们大家好
欢迎来到管理定量方法课程
我是今天的主讲老师 杨老师
第二十二节我们讨论相关与回归分析的
第四个部分
在这个部分我们将和大家一起来学习
多元线性回归模型
多元线性回归模型有很多应用
我们给大家举一些实例
比如说预测某地区旅游外汇收入的
基本状况
预测某公司的业绩
验证上市公司的大股东
占用上市公司资源的程度
与股权融资规模的关系
对总经理年度报酬决定要素进行实证分析
帮助企业识别真正驱动企业业绩
关键因素等等
以上的这些实例
其影响因素非常多
不能仅仅考虑一个要素
所以需要多元回归模型来帮助我们解决
和研究这一大类的问题
多元线性回归模型
主要讨论以下的几个话题
第一 多元线性回归模型及其方程的
基本形式
第二 回归模型如何来进行估计
我们使用的方法仍然是普通最小二乘法
第三 回归模型中回归系数的
基本含义是什么
第四 多元线性回归方程中的检验
多元线性回归模型中总检验
和回归系数的假设检验
第五 多元线性回归模型拟合效果的评价
复可决系数
估计的标准误
和皮尔逊相关系数
最后 我们讨论一下多元回归模型
在应用过程中需要注意的基本问题
首先我们来看一看多元线性回归模型的
基本形式
设总体的数据可以得到
总体多元回归模型
Y就等于β0加β1X1加β2X2
加β3X3
一直可以加到βkXk
再加上随机误差项
模型中有k个自变量
所以多元中 元代表的是自变量的个数
我们可以看到多元线性回归模型
和简单回归模型
在模型设置上不同点在于
多元回归模型研究
多个自变量X和一个因变量Y之间的关系
如果我们把后面的随机误差项去掉
就可以得到总体的多元线性回归方程了
去掉随机误差项之后
其实求的是EY一个总体的均值
若要得到一个有效的总体的
多元回归模型的话
对随机误差项是有严格的规定的
多元线性回归模型若成立
有五个基本的假设
第一个假设
随机误差项是一个随机变量
它应该服从正态分布
第二个假设 随机误差项的期望值
应该等于0
假设三 来自不同样本的
随机误差项的方差
应该相等
假设四 取不同的自变量的时候
自变量所得到的不同的随机误差项
应该相互独立
假设五 所有的自变量彼此线性无关
在后续的课程里
我们将和大家重点讨论假设三和假设五
假设三意味着很多多元线性回归模型中
存在着异方差
需要我们来解决
假设五意味着多元线性回归模型中
存在着多重共线性
这是多元回归不可避免的现象
需要讨论如何去识别共线性
以及如何处理共线性
在实际的研究中
我们更容易获得有效的随机样本
使用有效的随机样本来拟合回归模型
叫做样本线性回归模型
y就等于b₀加上b₁X₁加b₂X₂
一直加到bkXk 加随机误差项
如果把随机误差项去掉的话
就可以得到样本线性回归方程了
这也是实际应用过程中我们能够得到
样本的线性回归方程
ŷ就等于b₀加b₁X1加b₂X₂
一直可以加到bkXk
那么如何对样本线性回归方程进行估计
多元回归模型估计的基本过程
与简单线性回归模型是一致的
采用的方法都是参数的
普通最小二乘法估计
在多元回归模型参数估计
过程中会分成两类
一类是未经标准化的回归系数的
最小二乘估计
一类是标准化的回归系数的估计
首先我们看一看未经标准化的
回归系数的最小二乘估计
基本的原理和简单线性回归模型是一致的
用实际的点Y减去模型ŷ括起来的平方
把残差的平方求一个和
使得残差的平方和最小
得到的统计量就是参数最好的估计量
计算的方法仍然是求一阶偏导数
我们让一阶偏导数等于0求极值
就可以求得最优的最小二乘法估计值
这样就得到了未经标准化的回归系数
这里面我们给大家展示了一张
IBM SPSS软件展示出来的
多元线性回归模型统计结果
统计参数表里
会展示出来未被标准化的回归系数
可以把模型设置出来
ŷ就等于256.455加15.715X₁
加12.758X₂
多元线性回归模型回归系数的基本含义是
当其他的因素不变
广播广告费用X₁增加一个单位
销售额Y平均增加15.715个单位
当其他的因素不变
电视营销广告费用X₂增加一个单位
销售额Y平均增加12.758个单位
这就是未经标准化回归系数的经济解释
多元线性回归模型和简单线性回归模型
最大的不同点在于
多个自变量研究多个自变量X
对于一个因变量Y的影响
当自变量X对于因变量Y的影响
都是显著的
那么我们需要考虑哪一个自变量X
对于因变量Y的影响是最大的
因为自变量有不同的量纲
在讨论不同的自变量X
哪一个对因变量Y的影响最大的时候
需要利用标准化之后的回归系数
来进行讨论
对于因变量Y和所有的自变量X
进行标准化
把变量减去自身的均值
再除以自己的标准差
标准化之后
根据标准化的数据来拟合的样本回归方程
就得到了标准化回归系数的
样本回归线性方程
这个方程也会显示在统计软件生成的
回归系数表里
这里给大家展示了刚才那道例题
标准化回归系数方程
y海德标准化之后就等于0.538乘以X1
加上0.271X2
标准化之后
回归方程的常数项为0
我们可以看到自变量X₁
对于因变量Y的影响会更大一些
其标准化的回归系数为0.538
得到了多元线性回归模型的回归系数之后
还不能够利用模型进行预测
需要对多元线性回归模型进行
显著性的检验和模型的评价
多元回归方程的显著性
与简单线性回归模型不同的是
需要进行多元线性回归模型的总检验
即F检验
在模型评价中我们会介绍到经调整的
复可决系数及样本的相关系数矩阵
及偏相关系数的概念
首先 我们看看多元线性回归模型的
总检验
总检验的过程应用了F分布检验
总检验的基本原理是什么
在多元回归模型的建模过程中
我们会担心当丢入多个自变量的时候
推广到总体
多个自变量x前面的回归系数β₁β₂
一直到βk将可能同时为0
也就是自变量和自变量之间可能会
相互干扰
在这个时候需要对多元回归模型
进行一个总检验
总检验的基本流程
我们给大家进行了梳理
第一步 提出假设
假设检验的原假设
H₀是β₁等于β₂
一直等到βk等于0
假设检验的备择假设
H₁是并非所有的β
都同时为0
我们需要拒绝H₀接受H₁
这样模型就通过了总检验
模型在总体上是成立的
第二步 给出一个显著性水平
α显著性水平由 F检验的
两个自由度来决定
一个自由度是分子的自由度k
另外一个自由度
是分母的自由度n-1-k
第三步 构造一个F统计量
F统计量的构造是非常巧妙的
F统计量实际上就等于SSR
除以它的自由度k
再除以SSE除以n-1-k
SSR是由模型所解释的变差
它的自由度为k
SSE是未被模型所解释的变差
也就是残差平方和
它的自由度是n-1-k
这里SSR越大
F值就越大
F统计量落在了拒绝域
因为F检验是一个右尾的检验
SSR越大
F值就越大
而且意味着模型的拟合优度R方也就越大
所以 F检验对于模型的评价
和模型的总检验来说
有两种非常重要的含义
很多研究会说
当模型的F值较大的时候
模型的拟合效果R方也会越大
这句话是对的
第四步 如果我们得到F分布值
超过了临界值F*
则拒绝H₀ 接受H₁
也就是F值落在了拒绝域
这样模型的总检验就通过了
好 这节课就上到这里
同学们再见
-第一节 管理学研究概述
-第二节 研究的有效性
-第一章 习题
--第一章 习题
-第三节 数据的采集(一)
-第四节 数据的采集(二)
-第五节 问卷与访谈
-第二章 习题
--第二章 习题
-第六节 变量的测量(一)
-第七节 变量的测量(二)
-第三章 习题
--第三章 习题
-第八节 数据的描述
-第九节 概率与随机变量(一)
-第十节 概率与随机变量(二)
-第十一节 抽样分布
-第十二节 参数估计
-第十三节 假设检验(一)
-第十四节 假设检验(二)
-第四章 习题
--第四章 习题
-第十五节 问卷的结构效度——探索性因子分析(一)
-第十六节 问卷的结构效度——探索性因子分析(二)
-第十七节 聚类分析(一)
-第十八节 聚类分析(二)
-第五章 习题
--第五章 习题
-第十九节 相关和回归分析(一)
-第二十节 相关和回归分析(二)
-第二十一节 相关和回归分析(三)
-第二十二节 相关和回归分析(四)
-第二十三节 相关和回归分析(五)
-第二十四节 违背基本假设的回归(一)
-第二十五节 违背基本假设的回归(二)
-第二十六节 违背基本假设的回归(三)
-第二十七节 多重共线性的诊断和修正(一)
-第二十八节 多重共线性的诊断和修正(二)
-第六章 习题
--第六章 习题
-第二十九节 硕士学位毕业论文指导(一)
-第三十节 硕士学位毕业论文指导(二)
-第七章 习题
--第七章 习题