当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 3.8 IVE for corss-overs 2
Ok这是第一组
这个是training status
t是内生的
我们刚才说了他的估算值我们直接就跑回归
那么估算值大家可以看到大概是在男性是在
比如说三千七百多
女性是在2200多左右
那么第二组就是说我们直接在Di上来去跑回归
当然Di它是外生的
但是并不是所有人遵从了Di对不对
我们叫它reduced form在IV里面
那么我们在rct叫什么呢
在rct里叫他 Itt intention
to treat
大家可以看到估算值是不是又低很多
这个男性就跑到了1000上下了
女性也是1000上下
男性从3000多掉到1000
女性从2000多也掉了1000多
这就是因为很多人他其实被分到了Di=1
但他没有来参加 training导致这样的一个结果
但是这个结果到底有没有意义呢
这个结果也是有意义的
是不是
Reduced form虽然我们并不关心它
我们关心的是t的
根据他实际接受treatment的情况
我来看这个treatment effect的大小
但是Di在rct里面它有它特殊的意义
然后Itt那么大家想在比如说在医学里面
医生开的药
病人是不是一定会吃
不一定是不是你们去医院看病
可能医生开了药
你回家吃了一天就扔那就不吃了
是吧
等等这种情况是很常见的就是说我给你分了
treatment
但是你没有接受它
或者只是部分的接受他
那么但是也在这个是现实
所以说在医学上评估药的疗效的时候
他会把这一部分比例算进去
因为病人没有吃这个药
可能也确实是因为他吃了一次发现药效不明显
或者说是它有一些副作用
或者等等一些各种情况
才使得他自选择不去吃这个药
哪怕给他开了这个药
所以说对他来说有意义的
那么作为政府的一些项目
比如说免费的为找不到工作的人提供training提供工作培训
它提供培训之后有些人不来
这个也是现实
但是当我们去估算政府的项目的整体收益的时候
整体的 social benefit的时候
是不是我们也要考虑到这些因素
有的人说起不来
可能是他听说别人讲说这个东西培训没有什么意思效果
所以他不去
也是有可能的
所以这些其实他都应该被包含在我们对整个项目的评估中
从这个意思讲
itt是有它特殊的价值和意义的
虽然它并不是这个项目本身非常specific这样的
一个treatment effect
好
那么我们要的 specific treatment
effect呢当然就是这种形式
用两阶段
最小二乘法之后我们带入用 d的表达式来去代替内生
解释变量t那么来去做这样的一个估算
当然我们会纠正残差的计算方法
那么我们可以看到说最后 Iv纠正之后的估算值
是不是在1500左右
女性在1700-1800左右
那么这个是不是正好是在刚才那两组值之间
是不是
所以说这个是一个无偏估计
这个正好是在两个
一个是 ols的有偏估计
他过高的估计了这个效果和无偏估和刚才我们说的
itt之间就是这么一个值
好
大家有没有问题
好
没有问题
我们来看一下瓦尔德估计显然这种最简单的情况
不论是内生解释变量还是工具变量
它都是二元变量
那么它就非常符合我们瓦尔德估计的这样一个简单的式子
那么大家来看一下
其实刚才这个答案都给大家了
我们是来做一个分析
回过头来做一个分析
就这几组数字数值之间它们到底有一个什么样的比例关系
这个是瓦尔德估计能够帮助我们来分析的
这个是刚才给定的数字
之前那几组结果你们看PPT的回放也都能看到
那么请大家用瓦尔德估计的方法把beta1的系数再给写一
遍
好吧
我们来看一下
大家一起来看一下
你们如果愿意提交也可以
不提交的话
这道题也不会记录你们的考核
不用担心
我们来看一下
上面是瓦尔德估计的计算公式
对吧
大家注意这个条件都是Di条件都是Di是一个外生的
那么分子是Y关于Di的条件期望的差值
分母是这个应该是t敲错了是t关于Di的就是与
内生解释变量关于Di的条件
概率的条件
期望的差值
我们来看 y关于Di的条件概率的差值
刚才我们是不是看到了
在第二组结果里面是不是
第二组结果里面我们直接 Itt
intention to treat它大概的系数
大家可以看到是不是1200左右
是吧
那么那么这个分母是什么呢
分母是刚才我们说的cross over的比例是不是正好是60%-2%
我分他去第一组
然后他最后接受treatment
他的条件期望跟分他去D0组分他去control
group
然后他的条件期望他参与状态的条件
期望我们把它算出来
就是60%和2%
当然我们就把那2%忽略了
大概是0.6
那么一做比就是1800左右正好就是 Iv
estimation的值的大概的范围
我们刚才看了
是不是
所以刚才这三三组之间实证的结果跟我们理论上来去看
它瓦尔德估计的公式
它是完全匹配的
他大概就是这么一个比例的一个缩放第一步
第二步跟 reduced form它系数之间的比例
关系
我们本来设计 rct就是为了要它的随机性
但是在实施过程中
因为被试的特点以及我们要遵守一个最基本的研究伦理
我们不能强迫被试
一定要怎么样
所以说就会出现cross over的问题
这个时候我们不想放弃难得的实验的一个机会和数据结果
我们通过Iv estimation来解决了这个问题
当然了这个里面我们是不是也要做一些澄清
对不对
我们Iv estimation得出来的结果什么
是一个local的treatment
effect等等
就所有使用IV的讨论都适用于这里
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM