当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 2.8 Example of IV estimation
这个题有一个很长的故事
不要急
那么这个文章相信大家都看到了
这个是一篇非常经典的文章
安格瑞斯跟克鲁格在91年的时候
这篇文章貌似比你们都大
是不是
那么它们想研究 schooling
schooling对于工资的影响
这个题目为什么重要
因为在实行大众化教育的时候
政府的决策,政策决策者就要考虑到底
让花这么多钱让大家上这么多学有没有用
他们会讨论这个问题
所以说这个问题就是在历史上是很重要的
当然我们刚才说了schooling它是一个内生解释
变量
安格瑞斯跟克鲁格搞了一个什么工具变量来去
处理呢
他找的就是根据当地的一个法律
美国有什么法律呢
美国的法律是说首先所有的孩子都应该在他年满6周岁的
那一年去上学
比如说学校开学的日期是9月1号
那么他在他的生日不论是这一年的哪一天
只要他在这一年里面要过6岁生日
那么他都要在这一年的9月1号去上学
这是第一个
第二个
在美国很多高中的学生他特别想辍学
这跟中国不一样
美国高中的辍学率是50%
非常高
那么所以政府有规定
说你辍学可以
但是你必须要过了16周岁的生日以后才能辍学
所以大家可以看到其实学生的入学的年限那么跟辍学的年
要求是不太一样的
比如说举两个例子
如果有两个人两个学生
他们有一个是1月出生的
有一个是12月出生的
那么他们都会在6岁的时候
6周岁的那一年入学
他们同时上学
因为学期开学是固定的时间
但是他们如果都想在高中的时候辍学的话
1月出生的Bob
他就必须要在它就可以在1月2号以后
他过完生日以后
他就可以辍学了
但是John因为他的生日是12月的
他就必须在学校里面一直呆到12月份
他过完生日才能辍学
所以这个John他就在他看来非常倒霉的多在学校里面呆了一
年时间
多呆了11个月
比 Bob。这就是法律规定的这样的一个条件
大家想这个是不是一个很有意思的外生性的东西
也就是说每一个人他在几月份生这个事情
我们认为是随机的是吧
他是我们所研究的教育系统外的这个因素决定的
他不能由任何因素来决定
那么但是因为这样的一个政府的这样的一个法律的规定
使得生日的月份对于他辍学的具体年龄精确到月份
它产生的影响使得他们的schooling的时间
它们就发生了这样的一个...也带来一些影响
那么这个就给我们带来外生性
比如说大家想这个出生在第几季度
比如4个季度
出生在第几季度这个事情
它是不是会影响学生的schooling
就是上学的年限
它会影响他
因为法律的规定使得他出生在第一季度的人
如果他们都想辍学的话
那么出生在第一季度的人
他schooling时间又短
好
把这个背景介绍完
那么出生在第四季度的人
比如说12月的人
他的schooling的年限它就长
是不是
出生季度确实会影响schooling
但是你想这个出生季度显然不会影响未来工资
对不对
除非你这个玩星座
它不太可能说是我出生在哪个季度
我就会未来工资会不一样多
是不是
所以说这个显然在理论上工具变量 z它并没有直接的去
影响y是不是在理论上没有影响y
那么这是描述统计是把这个人群按照它的出生季度来描点
看他 years of schooling,上了多少
年学
发现确实在大部分cohort, 10年是一个cohort
year of birth,每年的情况
那么确实很多在你看在第一季度跟第二季度的人
他的上学的年限是最短的
那么在第三季度跟第四季度的人
他上学的年限是最长的
是不是
就发现了一个跟我们推理一致的结论
同时简单看一下它们的工资 weekly wage
一个星期的工资
也发现了确实好像是一第一季度跟第二季度出生的这些人
他们未来的工资要低一些
三季度跟四季度的人他未来工资要高一些
是不是
貌似是有这样的一个效果的
Ok我们先休息几分钟
我们再接着讨论
有问题也可以再讨论去问
那么在这样的一个例子里面
我们把它总结一下
首先我们感兴趣的回归方程是这个 log wage
它等于β0加上β1*education加 residual
Education是一个内生变量
就是years of schooling
years of education
这个时候我们成功的找到了一个根据政策的强制性的这种
外生性的这样的一个特点
我们找到了一个很好的工具变量z我们把它这么来定义
z是一个二元变量
如果这个学生出生在第一或者第二季度就是上半年
z就等于这个1
如果出生在三四季度
z就等于0
这个就是二元的一个工具变量
这个时候我们就可以套瓦尔德公式来去计算一个无偏的
一个β1
这个是我们的目标
那么好
下面大家来看一下这个表格
这个表格里面是给出几个均值
出生在第一季度跟第二季度的也是z等于1的情况是第一
列
就是z=1
那么出第二列是z等于0出生在后半年的这两种情况
在这两种情况下
x和y log wage 就是y了
对不对
X是education
它们的均值分别是多少
全给我们算出来了
根据我们前面说的瓦尔德公式
请大家来求出β的无偏估计
好吧
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM