当前课程知识点:计量经济学 > 1.计量经济学基础 > 1.2 -数据-变量-模型 > 1.2 数据-变量-模型
对研究对象的特征
进行测量
得到数据
把数据组织起来
形成变量
变量和变量之间的数量关系
就构成模型
把同一对象
在不同时间产生的数据
按一定顺序组织起来
这样的数据
叫时间序列数据
把同一时间不同对象
产生的数据
组织起来
这样的数据
称之为截面数据
将两者结合起来
把不同对象在不同时间
产生的数据
按一定顺序组织起来
就得到混合数据
例如
不同的班级
在不同年份的数据
如表格形式
这就是一个混合数据
对于方程
其中的变量Yi、Xi
平时我们习惯上
有不同的叫法
通常
把变量Yi称为
被解释变量
或者依赖变量
响应变量
内生变量
目标变量
回归子等等
而Xi
称之为解释变量
或者独立变量
刺激变量
外生变量
控制变量
或者回归元等等
在中学的时候
我们习惯于把Xi
称为自变量
Yi称为因变量
根据变量的性质不同
又可将变量分为
定性变量和定量变量
当存在多个解释变量时候
根据解释变量
对Y的作用形式
又可以分为
独立作用
和交互作用
两种形式
所谓交互作用
是指多个解释变量
可能联合起来
对Y产生作用
打个比方
解释变量(有)两个
性别和上学年龄
被解释变量(为)收入
解释变量
当中的性别和(上学)年龄
可以单独影响收入
也可能
联合起来
共同影响收入
假设模型中变量X₁i代表收入
X₂i代表财富
Yi代表消费支出
实际当中
我们采集
三组数据变量
代入(这个)数学模型
是无法使这个模型的
左右两边总相等的
当数学模型
左右两边
不相等的时候
我们人为地
在模型的右边
加入一个变量ui
使方程相等
这个时候
实际上
是在原来的
数学模型当中
加入了一个变量项ui
ui我们称之为
随机项
扰动项
误差项
残差项等等
加入随机项的模型
就变成了一个
计量经济学模型
对残差项
我们可以给出一些解释
帮助大家理解
影响消费支出Yi
除了收入
和财富之外
还可能存在
其它变量的影响
那些遗漏了变量的影响
可以包含在
残差项ui当中
也可能是因为
反映消费支出的模型
在理论上
存在缺陷
或者是存在模糊性
那么这种缺陷或者模糊性的影响
也可以包含在残差项ui中
也可能是
变量所选择的
测度方法的有效性太差
这种影响
也可包含在ui中
也可能是因为
测量数据的方法
存在测量误差
也可能是因为
人类的经济行为本身
存在内在的随机性
总之
我们把这些影响
都归结到残差项当中
所以
计量经济学的重要任务
就是分析残差项
并尽量
提取其中的
有用的信息
使得到的方程
是有效的
计量经济学当中
最常见
最常用的是
线性回归模型
什么是线性
所谓的线性是指
只有加法
和数量乘法的运算
叫做线性
所谓数量乘法是指
常量*变量
因此
根据这个标准
第一个方程
就是一个线性模型
对于第二个方程
注意
这里的Xi²
并非数量乘法
但是
当我们把Xi²
当作一个整体来看的时候
这个方程
又可以作当一个
线性(模型)来处理
因此
我们通常把它称之为
对参数是线性的
以后
我们说线性模型
也包括
第二个方程当中
类似的
对参数是线性的情况
那什么叫回归呢
所谓是回归
是指给定Xi
来预测总体Yi的平均值
或者是
来预测总体Yi的期望值
这叫回归
回归模型(往往)
是用来解释一个
或者是多个变量
对另一个变量的影响
换句话说
是用来解释Yi
对一个或者是多个变量Xi的
依赖性的
总体回归函数
和样本回归函数
是回归分析的
重要概念
重要概念
以收入-消费模型为例
已知收入为80
此时会有不同的消费支出
收入为100
120
140等等等等的条件下
都有不同的消费支出
注意
第一个红点
代表收入为80的时候
平均消费支出
第二个红点
代表收入为100时的平均消费支出
依此类推
把这些红点
连成一条直线
这个时候
我们就得到
总体回归函数
注意
方程左边
是条件均值
方程右边的系数
没有带^
这种形式的方程
叫总体回归方程
但是
在实际当中
我们是做不到这一点的
换句话说
我们无法得到
不同收入情况下
所有消费者的消费支出
实际当中
我们(往往)是根据
随机原则
抽取一个样本
例如
这些黄色的点
不同的人
抽取的样本
肯定不一样的
根据这些黄色的
样本点
可以用一条直线
来拟合
这些点的信息
这条直线
我们把它
称为样本回归函数
样本回归函数
是根据
样本得到的
表示为
这样的形式
注意
方程左边Yi
上面带^
表示
Xi给定的情况下
样本回归直线上面的
对应点
方程右边的回归系数
也带^
以后约定
方程中带^的部分
表示是根据样本信息得到的
Xi会带^吗
当然不会
Xi是已知的
β1^
是样本回归函数的
截距
β2^
是样本回归函数的
回归系数
我们做回归分析
就是要根据
样本回归函数
SRF
来推测
总体回归函数
PRF
由于
总体往往是不可知的
因此
实际上
无法得到总体回归函数
所以
总体回归函数
是一个
理想化的概念
但是
我们可以基于样本信息
得到
样本回归函数
进而推测
总体回归函数
但样本是波动的
N个不同的样本
就会得到N个不同的样本回归函数
样本回归函数
它的作用
就是用来估计
总体回归函数的
在这个估计当中
模型的扰动项
起着关键作用
对这一点
我们的学习当中
将会有
更加深刻的认识
-1.1-教学构架
--1.1-教学构架
-1.1E-文件、数据、变量与群实验
-1.2 -数据-变量-模型
-1.2E1-窗口与菜单实验
-1.2E2-变量描述统计与显示实验
-1.3-假设检验的一般逻辑
-1.3E-齐性检验与分布检验实验
-第一章 作业
-2.1最小平方法与决策系数
-2.2 CLRM假设条件
-2.3 回归分析
--2.3 回归分析
-2.3E1 回归分析实验
-2.4 回归检验
--2.4 回归检验
-2.4E1 回归检验实验
-2.4E2 回归检验实验
-2.5 预测与分析
-2.5E 预测实验
-第二章 作业
-3.1非线性回归模型的线性化(1)
-3.2非线性回归模型的线性化(2)
-3.2 E非线性化的转换实验
-第三章 作业
-4.1哑变量及设置
-4.2哑变量的回归
-4.3结构稳定性问题
-4.3E哑变量回归实验
-第四章 作业
-5.1异方差概念及其后果
-5.2异方差侦测方法
-5.2E异方差侦测实验
-5.3异方差救治措施
-5.3E异方差救治实验
-第五章 作业
-6.1自相关性及其后果
-6.2自相关性侦测方法
-6.2E自相关性侦测实验
-6.3自相关性救治措施
-6.3E自相关性救治措施实验
-第六章 作业
-7.1多重共线性及其后果
-7.2多重共线性侦测方法
-7.2E多重共线性侦测实验
-7.3多重共线性救治措施
-7.3E多重共线性救治措施实验
-第七章 作业
-8.1模型选择:标准与检验
-8.1E模型选择:检验与实验
-第八章 作业
-课程勘误
