当前课程知识点:计量经济学 > 4. 哑变量回归 > 4.1哑变量及设置 > 4.1哑变量及设置
数据有四种类型
第一类是定类数据
例如
性别、种族、肤色等等
这类数据没有大小
也不讲顺序
第二类数据是定序数据
这类数据没有大小
但是它有顺序关系
例如
一年级、二年级、三年级、四年级
就是定序数据
春、夏、秋、冬四季
品质的优、良、中、差
都是定序数据
第三类数据是定距数据
这类数据有顺序
有大小
但是其中的0是相对的
这类数据可以做加法和减法
但是除法和乘法往往没有意义
比方说温度就是定距数据
大家想一想
0度并不表示没有温度
1度是0.1度的10倍
但不能说1度的时候比0.1度热10倍
定序数据的乘法和除法没有什么意义
第四类数据是定比数据
我们平常接触比较多
也比较熟悉
例如
身高、体重、交易量、货币量等等
有大小
有顺序
可以进行加法、减法、乘法、除法
所谓的哑变量主要是指由定类数据和定序数据构成的变量
我们如果对定性数据构成的变量进行回归
首先要将定性数量进行数量化设置
今后我们把哑变量又称为虚拟变量
二值变量
分类变量
定性变量等等
通常用D表示哑变量
它的取值为0和1
下面我们讲哑变量的设置
先看简单的性别如何设置
性别是一个类别
分男女两种情况
这样一个类别
两种情况
只需要用一个哑变量就可以表示
D=1表示男性
D1=0表示女性
反过来也行
又如把学历分三种情况
高中及以下、大专、大学及以上
这也只有一个类别
但有三种情况
如何用哑变量进行设置呢
这时需要两个哑变量
D1、D2
注意每个哑变量都只能取0和1
不妨设D1=1表示高中及以下
D1=0表示其他情况
D2=1表示大专
D2=0表示其他情况
根据上面的设定
性别男女分别用一个哑变量1、0表示了
学历情况则需要两个哑变量D1和D2结合起来才能表示
即高中及以下用D1=1、D2=0表示
大专用D1=0、D2=1表示
大学及以上用D1=0、D2=0表示
注意
哑变定的设定不同
表示也不同
但是他们本质是一样的
如何表示一年四季呢
四季是一个类别
但有春夏秋冬四种情况
需要三个哑变量来表示
例如
D1=1表示春天
D1=0表示其他
D2=1表示夏天
D2=0表示其他
D3=1表示秋天
D3=0表示其他
如果有两个类别
如性别和肤色
每一类别又有不同情况
如何用哑变量表示呢
例如性别分男女
肤色分白人和黑人
这时候性别用一个哑变量
肤色用另一个哑变量表示
如D1=1表示男性
D1=0表示女性
D2=1表示白人
D2=0表示黑人
根据上面设定
一年四季用D1,D2,D3三个哑变量表示
依次表示为
春(1,0,0)
夏(0,1,0)
秋(0,0,1)
冬(0,0,0)
对性别+肤色的情况
用D1、D2二个哑变量来表示四种情况
依次为女性黑人(0,0)
男性黑人(1,0)
女性白人(0,1)
男性白人(1,1)
我们学会对哑变量进行设定以后
就可以将定性特征表示为数据
为一步进行带哑变量的回归分析做好了准备
-1.1-教学构架
--1.1-教学构架
-1.1E-文件、数据、变量与群实验
-1.2 -数据-变量-模型
-1.2E1-窗口与菜单实验
-1.2E2-变量描述统计与显示实验
-1.3-假设检验的一般逻辑
-1.3E-齐性检验与分布检验实验
-第一章 作业
-2.1最小平方法与决策系数
-2.2 CLRM假设条件
-2.3 回归分析
--2.3 回归分析
-2.3E1 回归分析实验
-2.4 回归检验
--2.4 回归检验
-2.4E1 回归检验实验
-2.4E2 回归检验实验
-2.5 预测与分析
-2.5E 预测实验
-第二章 作业
-3.1非线性回归模型的线性化(1)
-3.2非线性回归模型的线性化(2)
-3.2 E非线性化的转换实验
-第三章 作业
-4.1哑变量及设置
-4.2哑变量的回归
-4.3结构稳定性问题
-4.3E哑变量回归实验
-第四章 作业
-5.1异方差概念及其后果
-5.2异方差侦测方法
-5.2E异方差侦测实验
-5.3异方差救治措施
-5.3E异方差救治实验
-第五章 作业
-6.1自相关性及其后果
-6.2自相关性侦测方法
-6.2E自相关性侦测实验
-6.3自相关性救治措施
-6.3E自相关性救治措施实验
-第六章 作业
-7.1多重共线性及其后果
-7.2多重共线性侦测方法
-7.2E多重共线性侦测实验
-7.3多重共线性救治措施
-7.3E多重共线性救治措施实验
-第七章 作业
-8.1模型选择:标准与检验
-8.1E模型选择:检验与实验
-第八章 作业
-课程勘误