当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 4.6 DID with multiple periods 1
好 我们来探讨
多期模型多期的好处
刚才已经说过了
但是这个模型稍微有一点点复杂
所以大家要仔细听
你有问题你一会你现在就问
那么这个例子
这个例子是一个劳动力经济学的例子
这个例子是说什么呢
就是说
公司
大家知道公司雇佣员工作为公司老板
他当然希望自己有什么权利
他希望自己有随时裁员的权利
对不对 比如说我
经济形势好
我公司盈利水平高
我可以养很多的员工
但是当我亏损的时候
我就希望能够裁员
这是公司老板希望有的权利
但是作为工会
它希望
或者说作为普通的员工
他希望什么
他当然希望铁饭碗 就是说
不论公司过得好不好
我都希望自己不被解雇
是不是
这个是员工或者是工会希望得到的权利
那么这两个是
当然是矛盾的
就像现在疫情对不对
疫情导致服务业
亏损
这个时候如果它不能解除员工的话
它就倒闭了 因为它发不出工资来了
就负债了 就是这样的一个问题
那么
在美国它就通过了一个法案
通过了一个什么法案呢
不允许雇主随便解雇员工
如果这是你的正式员工
你就是不能随便解雇它
这个是一个法案
这个法案显然是保护劳动者的
保护员工的
但是
它的本意往往不可能被实现
为什么
大家想如果你是雇主的话
如果劳动法规定你不能随便解释
随便解雇正式员工
你会怎么做
你就会不再雇用正式员工
你去雇用什么
雇用临时工
对不对
就是说 outsourcing
就是说我是以任务为机制的任务
我包给你你完成它我就给你这一份钱
对**说的对,派遣工对吧
就是这种性质外包就可以了
我不跟你有劳动雇佣合同
但是我们有买卖
具体服务的这种合同
那么这个就是雇主会干的事
这个本质上伤害的还是谁
还是正式工对不对
因为他本来可以获得一
份正式的稳定工作的
但是因为雇主对法院的反应
使得说雇主不愿意雇佣他了
他就只能变成什么
变成临时工了 对不对
所以很多时候
这就是劳动力经济学的两派经常去争论的
就是政府的政策到底是办
了好事还是办了坏事
我们来看一下
就是政策
它在不同的州 它在不同的州
是法案的实施的
你两个周实施年份是不一样的
我们就在看这个政策产生的效应的差别
Ok这是刚才说过的
我们来看这个模型
这个模型显然比刚才的两期的
DID一下子复杂了
我们来仔细的来去分析一下模型
大家来看
Yist
i是什么
i是individual firm
这里面的最小
这个样本有个单元是这个公司
s什么 S是州
S这里面我们只有两组
就是一个treatment 一个是control
也就是说在treatment这一组在t
等于0这一期法案就实行了
就不允许雇主随便解雇员工了
那么
s等于0的州
再就是control group
就是这个法案在我们研究的这些年份里面
它一直没有
没有实行没有立法
所以s它是 treatment
跟control的这样的一个
dummy
么t是什么 t,t是年份
那么τ这是一个新的概念
大家注意τ是什么
τ是
对年份进行了一个中心化
也就是年份是自然年份对吧
1981,1982,1983这是自然年份
τ是什么
是以treatment
实施的当期
政策发生了当期
我们把它中心化定义为0
那么政策实行后一期
-1
政策实行后两期就是-2
政策执行前一期是+1
政策执行前两期是+2
为什么正负是这样子
跟中文的概念是反的
是因为在英文里面
政策执行之前我们叫leads
政策执行之后叫lags
lags
就滞后效应
所以它按照这样的一个
语言的一个色彩
就把正负号是这么来标的
没有关系
那么显然零期跟-1期呢
就跟我们的两期DID里面
它对应的那两期
那就是0和1它是一致的
Ok 我们来看这个式子
βs
我们叫它什么
叫州固定效应
固定效应这个词咱们已经学过了
州固定效应显然就是
s=0跟s=1的差值是吧
这里就简写为βs
ok 那么
这个γt叫year fix
effect
就是年份固定效应
年份固定效应
大家想一下
它是不是多年
两年之间的每两年每两年之间的
差值
就是被年份固定效应所控制了
也就是比如说如果我们有10年的数据
假设
每一年跟每年之间
因为宏观形势的差异
那么它整体上在
比如说正式工的雇佣率
临时工的雇佣率等等各方面
它都有一个宏观的变化
它不是法案本身的变化
那么这个叫year fix
effect
对吧 它是一组什么
一组dumy对不对
是一组dummy 当然它有一个基线
比如说
第一年或者怎么样
我们选一些做基线就可以了
所以 year fix effect
大家想一下
在
两组
两组的多期DID里面
它是不是
time trend就是
common time trend那
一部分
因为这两个州对不对
随着整体的宏观形势变化
它的共同的时间趋势就是两年之间的差值
就被γt给刻画出来了
所以这一点我们叫做year
fix effect
它在这个地方
time trend
然后我们来看这个leads跟lags
这个是我们标好了
这个是个连加号
那么这个里面对于
待会我们会详细的讨论什么是Dstτ
和Dsτ在这里
这个s
只有两个值 就是0和1
对不对
τ我们刚才说了
如果有5期的话
我们把它定义为+2+1
0-1-2这5期
那么Dsτ也是一个dummy
它在什么情况下等于一
首先 s必须等于一
也就是它是在treatmentgroup
如果这个公司
是在
政策立法的所在州
也就是s等于1
然后它这个数据正好又是第τ期的数据
那么Dsτ淘呢
才等于1
其它情况都等于0
那么这是一个
dummy的定义
大家看dummy的定义其实是不是
它是有两组概念
那么它其实是要同时满足两个条件
Dsτ才会等于1
也就是说 Dsτ的定义就
告诉我们它本身就已经是
一个交互项了
只不过是我们用一个符号来表示了
那么对应的 Dsτ的参数
它的系数
我们就用δ来表示
那么
那么这个地方的系数就在这
当然我们还可以加入自变量以及我们的
残差
大家看残渣是
εist
也就是说它是在州内
不在某一年里面
各个individual之间的残差
这个fix effect在这儿
我们用的是fix
effect model不是random
effect
如果是random effect
大家想一下这个地方应该还有什么
是不是还有组间残差
那么这个地方我们把它做成
fix effect
这就跟我们上一
上一讲的内容就联系在一起了
我们来重点看什么
看最难理解的地的数据结构
当然这里有个问题
就是δτ的具体含义到底是什么
我们来看这个是
刚才的一般的这样的一个回归方程的形式
我们把它展开展成一个具体的
就这种形式
我们有3期lags
3期就是0-1和-2,3期lags
有两期leads
两期就是1和2
那么
我们把它展开写
就写成这样的一个回归方程形式
这就很直观了
那么我们来看
对于不同的公司
它在每一年的数据
它到底 D的取值是怎么来赋值的
Ok 那么这个是
大家采到的数据
你这个数据里面我们现在就标几个变量
一个是Yist
一个是
γt
大家看 Yis t
这个i是individual
firm的 ID,我们可以从1开始
数
这个s就是州
这个州就两个州
要么是第一个州 要么就第二个州
我们说第一个州是treatment group
这个t就是年份
这个年份我们就是从90年
的数据到94年的数据
一共5年的数据
那么
比较清楚了
大家可以看到
显然
前5行数据是第一个州的第一个公司
它在这5年里面每一年的
outcome的取值
这个是我们可以观测的
当然我们出于方便对比方面
我们下面写的是第二个
州的
第二个公司
当然还可以是第一公司 没关系
我举例子 这是
它的每一年的数据
那么我们在第一个周里面
是不是我们还有第3个公司
和第3个第4个公司
是不是它们每年数据我们都有
我们就不一一列出来了
我们就举了两个例子
这个是我们可以观测的数据
这个是year fix effect
这个也是很容易
看明白的 就是
t给定了之后 γt
的取值是
我们是知道的
我们来看这几个D这是
我们新造出来的变量
这个D里面最重要的概念
是τ,是中心化之后的值
它们分别是怎么复制的
给定这5年数据
我们知道
92年是政策发生的
当期就是92年
τ等于0那一期
那么91年就是
政策发生前一期
90年的政策发生前两期
那么根据定义 Ds2
它就是政策
发生前两期
并且是在treatment
group的公司
它在Dx2的取值它等于1
否则就等于0
我们来看一下
是不是对于第一行样本
那么就应该是
Ds2=1
其它等于0
因为显然这一行数据它不是
政策发生前一期的数据
所以剩下这些都等于0
它也不是政策发生当期的数据
也不是这次发生之后一期的
也不是政策发生之后两期的
所以后面这些值都等于0
只有Ds2=1
那么
对于第二行数据
它是91年的
所以它就不是政策发生
后
政策发生前两年的
所以它 Ds2它是等于0的
但是它是政策发生前一期的数据
而且它是treatment
group的
所以说
在它的Ds1的取值就等于1了
那么其它是等于0的,解释是一样的
那么对于它在92年的数据
首先92年是政策发生当年
所以它不是政策发生前两年的数据
所以Ds2=0
同样Ds1也等于0
Ds0等于1了
那么后面还是等于0
这个没有问题 同学们
显然这个规律就被你们发现了
那么我们就可以把这些都写出来
是不是
所以说大家可以看清楚
从 Ds2到Ds-2
它的赋值数据结构是什么样子都出来了
那么显然对于在
s=2也就是control group的这些
这些数据
不论它是哪一个公司
哪一年的数据
因为它在control
所以它在所有的D里面
的取值是不是都等于0
因为D的定义就决定了
D的定义就是s等于1
而且又正好是在τ那一期
τ等于某一个
数值
那一期的数据它才会等于1
所以
control group
在所有这些数据里面 D里面都等于0
那么大家可以看到
这个显然
对于
在第一个州里面的 Y3Y4就是这些
这些公司
它们在90年的数据是不是
都属于这个τ等于2
所以它们
在Dsr的赋值也是等于一的
以此类推你就可以选
你就可以写出来所有的
样本点
它在
D它的取值
好 没有问题
这个数据结构搞清楚了
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM