当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 3.3 Idea of RCT 2
我们也把
答案做成PPT
我们一起来看一下
也就是还是我们观察的数值
那么我们把它分在分别写在两个部分
刚才**同学它也是把它
分别先写到了这个位置
然后我们也是加一项减一项
这一次我们加减的内容
就跟之前是不一样了
我们加减的内容是ti等于0的情况下
它如果接受了treatment
它的y1i的期望是多少
这个
我们分别加一项减一项等式是
等号是保持不变的
那么下面这一个部分
跟上面这一部分
它分别对应的就是ATNT
和 selection bias
为什么 因为
上面这一部分
它就是在对于ti等于0的人群对吧
也就是说
没有接受treatment
现实中我们观察到它没有接受
treatment的人群
那么它的y1i的
条件期望跟y0i的条件期望
的差值
也就是它如果接受treatment
跟它如果没有接触treatment
它的outcome的差值是多少
那么这个显然是
对于人群来讲treatment
effect是什么
我们就把它叫做ATNT
那么剩下的这一块是selection bias
也就是说这对于两组人
一个是现实中ti等于0的人群
一个是现实中ti等于1的人群是吧
那么如果他们都接受treatment
那么它们的差值是多少
那么这个地方就是selection bias
当然它跟前面selection bias是有点不一样
它是
我们看的是y1i的差值
这个没有关系 因为我们
只要它有bias就可以了
它到底是怎么定义的 其实我们
并不关心,我们关心的是怎么把它去掉
Ok
还是这个问题 大家想一下
ATT
跟ATNT
还有ATE那么这三个概念
那么这三个概念它相等吗
就说对于这两个人群
我们印象中那两群孩子
一个是
现实中在优质学校读书的孩子
跟现实中在农民工子弟学校读书的孩子
这两群人
如果他们都接受了treatment
都能够去优质学校
那么
treatment effect是不是相等
有的同学说不相等
我们先休息5分钟
然后我们来接着讨论这个问题
好吧
等式右边和ATE是什么关系
好 同学们我们接着讨论
就刚才这个问题
有同学刚才认为
它们不相等
有没有同学认为它相等
或者说你们对 ATT和ATNT
以及 ATE之间的关系
你们是怎么认为的
找一位同学回答一下
看看大家都怎么想的
来 **同学
老师
我认为它们三个不相等
为什么
加法就更不一定了
是因为
因为你的
同一个事物在接受了treatment
的群体和没有接受treatment
群体之间
我觉得它所带来的结果是肯定有差异的
为什么
这个结论
然后你要不要解释一下
为什么你这么觉得
可以
可以举实例吗
当然可以了
对
比如说我们高中的话会有实验班
跟平行班的这种概念吗
所以
如果我们
去
人为的做一些
不是 其实我想表达的就是
一个问题就是
实验班和平行班的同学
就是本身它们的能力
有差异的 在它们入学之前
如果
你在之后再对它们进行一些
treatment的话
我个人感觉
是会有差异的
好 谢谢
谢谢**
我觉得你解释清楚了
你想说的是它们本身因为个体的差异
使得它们在接受同一个吹它们的时候
它们可能会提
体现出不同的outcome
***也在聊天记录
聊天里面在说
我觉得说得很有道理
ATT跟ATNT呢
它其实是在两个群体中
的平均处理效应
一个是在现实中接受处理它们
的群体中的平均处理效应
一个是在现实中没有进入
treatment平均处理效应
所以从这个意义上讲
确实ATT跟 ATNT
都属于LATE
对不对
它都是一个局部的平均处理效应
局部就局部在它人群的限定上
那么等式左边是一个有偏的
有偏的ATE它等于ATT加上
一个selection bias
或者是ATNT加上一个selection bias
bias
那么这是因为是观测数据
所以说它是有偏的
那么是不是也有一些情况下
ATT
可以跟 ATNT也是可以相等的
那么如果它俩相等的话
是不是也同时就等于
ATE了
也就是说刚才举的这个例子
它可能是刚才**这个例子
可能它们确实是不相等
但是在有些情况下
是不是它也可以相等
比如说营养餐计划
是不是我们在农村地区
我们实行营养午餐
你说不论是成绩好的还是成绩差的
它是不是
午餐吃的营养好一点
它的身体都会长得更加的健康
这个时候ATT如果是营养午餐是
一个treatment的话
它是不是在
如果是我们的人群分组是
重点班和非重点班的话
那么其实它并不会
因为对药而产生不同的差异
是不是
所以说要看具体的人群和
我们的出现的是什么
对*说的没错
当ATT因为
两个人去 一个是treatment
一个是nontreated
所以说当ATT等于ATNT的时候
那么显然它也就等于ATE了
因为ATE是ATT
跟ATNT的一个
平它们俩的一个平均
可能是个加权
你就要看人群的多少
好
这么这几个重要概念大家有没有问题现在
好 没有问题的话我们就move on
如果有问题你们在群里面接着问
我们会随时再讨论
那么显然如果是我们用观测数据
来去做这样的一个估算的时候
如果出现自选择篇目
那么其实我们的观测的两这
两个人群的数值的差值
它也是有偏误的是吧
因为selection bias我们是估算不出来的
大家想一想
为什么估算不出来
因为这里面有一个counterfactual
的这一部分
是不是它反事实的部分呢
我们是观测不到的
因此虽然我们在概念上可以把它表达出来
用这个式子
但是我们在现实中因为观测不到这个数据
所以我没有办法估算出 selection
bias
使得我们就不能把 bias从
我们的观测数据里面剥离掉
是不是 这个就是问题
怎么解决呢
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM