当前课程知识点:数学建模 > 7 回归分析 > 7-3 数据的自相关I > 数据的自相关I
同学们好
这一节我们来看
时间序列和自相关性
我们先来看一个案例
说某公司希望用区域行业的销售额
来预测本公司的销售额
在这个表里面
给出了近五年的公司销售额
和区域行业的销售额
20个季度的数据
我们先来分析这个数据
有很多的经济数据
在时间上有一定的滞后性
以时间为序的数据
我们称为时间序列
时间序列中
同一变量的顺序观测值之间
往往存在自相关性
如果采用普通的回归模型直接处理
可能会出现不良的后果
需要判断并且消除
数据的自相关性
来建立新的模型
我们先来建立基本回归模型
根据前面介绍的线性回归方法
来建立普通的回归模型
我们设t为年份
yt为公司的销售额
xt为区域行业的销售额
我们来做散点图
这个散点图是因变量yt
和自变量xt的散点图
从散点图可以看出
随着区域行业销售额的增加
公司的销售额也在增加
公司销售额与区域行业销售额
有很强的线性关系
因此我们可以建立线性回归模型为
其中α0、α1是回归系数
εt是对t相对独立的零为均值
正态分布随机变量
将表中的数据代入模型
用Matlab统计工具箱
可以得到回归系数的估计值
以及在置信水平α0.05下的置信区间
还有统计检验量α平方
F检验值、p值、s平方的结果见表
这个模型的优点是
α的平方等于0.9988
也就是说拟合度很高
剩余标准差s等于2.3754 较小
模型的缺点是
模型没有考虑时间序列数据的
滞后性影响
可能忽略了随机误差存在自相关性
如果存在着相关性
用这样的模型会有不良的后果
因为对时间序列数据做回归分析的时候
模型的随机误差项εt有可能存在相关性
这就违背了模型对εt是对时间t
相对独立的假设
在我们这个销售额模型中
区域行业销售额以外的因素
比如市场环境因素
对公司销售额的影响
包含在了随机变量εt中
如果它的影响成为εt的主要部分
那么市场环境因素的延续性
对公司销售额的影响
也有时间上的延续性
也就是随机误差εt会出现自相关性
因此我们要去判断随机误差εt
是否存在自相关性
如果存在自相关性
我们就要想办法消除它
下面我们来看自相关性的定性诊断
我们可以计算模型的残差
可以将et作为随机误差
εt的估计值
用Matlab做出残差
et与et减1的散点图
可以直观判断随机误差εt的自相关性
在这个残差散点图中
如果大部分的残差点
落在了第一、第三象限
那么残差εt存在正的自相关
如果大部分的残差点
落到了第二、第四象限
那么残差就存在负的自相关性
由这个残差散点图我们可以直观的判断
这个基本回归模型的随机误差εt
存在正的自相关
这是自相关的定性诊断
下面我们来看自相关性的定量诊断
即 DW检验
为了对εt做自相关性的定量诊断
并且消除自相关性以后
得到新的模型
我们来看下面这样一个模型
我们看自回归模型
yt等于α0加α1xt加εt
其中εt等于ρεt减1加ut
这里面的α0、α1是回归系数
ρ是自相关系数
ρ的绝对值小于等于1
ut是对t相对独立的零为均值
正态分布的随机变量
当ρ等于0的时候
模型的残差项εt无自相关性
ρ大于0的时候
模型的残差项εt存在正自相关性
当ρ小于0的时候
模型的残差项εt存在负自相关性
在经济规律作用下
大多数与经济相关的时间序列数据
一般会随时间的推移
在一种向上或向下的变动趋势中
它的随机误差往往表现出正相关的趋势
那么我们该如何来估计自相关系数ρ呢
我们可以通过DW检验来估计
那么我们又该如何消除它的相关性呢
我们可以通过广义差分来消除相关性
下面我们就来看一下
DW统计量和DW检验
我们令DW等于
当n较大的时候
DW约等于
其中这是ρ的估计值
那么DW就等于两倍的1减去ρ的估计值
由于ρ的估计值是在负1到1之间
可以得到DW值在0到4区间
当ρ的估计值等于1的时候
DW等于0
当ρ的估计值等于负1的时候
DW等于4
当ρ的估计值等于0的时候
DW值等于2
样本容量、回归变量的数目
可以查DW分布表得到检验临界值
dL和dU
当DW值落在了0到dL之间
则模型的残差εt有正相关性
当DW值落在了dL至dU之间
那么模型的残差εt
不能确定它是否有自相关
当DW值落在了dU至4减dU之间
则模型的残差εt没有相关性
当DW值落在了4减dU
到4减dL之间
模型的残差项εt
不能确定它是否有相关性
当DW值落到了4减dL到4之间
则模型的残差项εt有负的相关性
下面我们来看广义差分变换
根据DW等于2倍的1减ρ估计值
我们得到ρ的估计值等于
1减去2分之DW
原模型yt等于α0加α1xt加εt
其中εt等于ρεt减1加ut
那么我们来做变换
yt星等于yt减ρyt减1
xt星等于xt减ρxt减1
我们得到新的模型
yt星等于β0加β1xt星加ut
这个模型是以β0、β1为回归系数
以ut为随机误差的普通回归模型
那么广义差分的步骤是
首先计算原模型的DW值
如果DW检验结果是
模型残差项εt无相关性
那么就可以使用原模型
如果DW检验值的结果为有相关性
那么要进行广义差分变换
得到新的模型来继续这个过程
如果DW检验结果为
不能确定模型残差项
εt是否存在自相关
那么就需要增加数据量
或者选其他的方法来进行建模
我们可以通过这个图来看
DW检验和广义差分的具体步骤
在这一节我们介绍了时间序列
自相关性
DW检验和广义差分的步骤
同学们下节见
-1-1 数学建模无处不在
--数学建模无处不在
-1-2 从现实对象到数学模型
-1-3 数学建模的基本方法和步骤
-1-4 如何学习数学建模
--如何学习数学建模
-1 数学建模无处不在--本章测验
-2-1 数学建模思维
--数学建模思维
-2-2 几种创新思维
--几种创新思维
-2-3 问题的提出与分析
--问题的提出与分析
-2-4 建模目标
--建模目标
-2-5 建模计划
--建模计划
-2-6 建立数学模型
--建立数学模型
-2 数学建模思维与过程--本章测验
-3-1 储蓄存单和抵押贷款买房
-3-2 单车租赁调度
--单车租赁调度
-3-3 最佳出售时机
--最佳出售时机
-3-4 名额的公平分配
--名额的公平分配
-3-5 汽车的油耗
--汽车的油耗
-3-6 传染病模型
--传染病模型
-3 数学建模初等方法--本章测验
-4-1 线性规划——生产计划
-4-2 线性规划——运输问题
-4 数学规划I--本章测验
-5-1 整数规划问题
--整数规划问题
-5-2 指派问题
--指派问题
-5-3 非线性规划
--非线性规划
-5-4其他规划模型
--其他规划模型
-5 数学规划II--本章测验
-6-1 层次分析法I
--层次分析法I
-6-2 层次分析法II
--层次分析法II
-6-3 其他评价方法
--其他评价方法
-6 层次分析法--本章测验
-7-1 线性回归I
--线性回归I
-7-2 线性回归II
--线性回归II
--线性回归III
-7-3 数据的自相关I
--数据的自相关I
-7-4 数据的自相关II
--数据的自相关II
-7-5 非线性回归
--非线性回归
-7 回归分析--本章测验
-8-1 数学建模方法综述
--数学建模方法综述
-8-2 数学建模报告
--数学建模报告
-8 数学建模方法与报告--本章测验