当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 6.1 Review of causal inference model
好 同学们
大家上午好
今天我们来讨论倾向分数匹配法
今天的内容
我觉得
特别适合讨论
所以咱们今天讨论的内容会多一点
那么我们今天有这么几块内容
简单的回顾一下我们的因果推断模型
我们已经
这一学期主要的因果推断模型都快
学完了
所以我们做一个简要的回顾
第二个我们专门讨论用观测数据
怎么样能够去减少自选择偏误
这个也是大家在
提前阅读课本的时候也都讨论过了
但是这里面我们来详细的讨论一下
同学们有什么问题也可以
在这个阶段的来问
这一块内容它看上去非常的基础
但是越基础的内容
又给我们提供一个非常好的机会
让我们重新的去审视
之前习以为常的这样的一些做法
它背后的原理是什么
如果没有这些模型
你自己能不能想得出来
这个是我认为它最重要的教学价值
所以我们会认真的讨论一下
接着我们就进入主题
就是关于 PSM的模型的
它的理念估算和假设检验我们会做这一块
之后我们会讨论一个special
issue
因为PSM这一块的
内容没有这么满
所以有一个很重要的话题
可能在一般的定向课的时候
不太可能专门的去讨论
所以我们会拿出来讨论 bad
control的问题
那么还有一部分内容
我觉得可能课上我们是没有时间去完成的
所以作为optional
放到PPT的后面
但是我们可能课上就不会讲
大家感兴趣的话可以在课
下的时候看这个PPT
并且可以把相应的论文找出来看关于
跨学科的学生固定模型
它也是用
另外一种思路来去解决
学生跟老师
匹配的过程中的自选择问题
就是我们的择班
选老师等等这样的问题
这个也是用观测数据来去解决自选择问题
所以我们
把它作为一个
选学的内容放在后面
好 这个是今天的genda
有没有什么问题
有问题大家可以随时打开麦克说
我们非常鼓励大家在开麦克
你在聊天区里说也是可以的
我再开一下弹幕
对
好 都可以 欢迎大家讨论
今天我们讨论会比较多一点
好
那么这个是咱们非常熟悉
的这样的一个框架了
RCT和 natural
experiment
我们把它定义为实验设计
那么
RD跟今天要讲的
PSM是准实验设计
那么其它的像工具变量等等
包括刚才我提的
student fixed effect model它们都属于observational data
它是
它不是实验设计
但是不是实验设计
如果能够得出一个causal
inference的话也是非常好的
那么也是可以用的
那么这个是从RCT一直到IV
在包括PSM我们已经讨论了
5个模型了
那么
它的实验它是什么样的一种实验设计类型
刚才我们说过了
它的重要假设
我们列在这里大家会看到说
每一个模型它的假设是很不一样的
那么这些假设
如果不能够满足的话
这个模型就不成立了
所以这个就是咱们高级
定量课很重要的一点
就是要知道每一个模型它的适用范围
它的假设是什么
我们怎么样去检验这些假设
这些是前提
而不是说
看着长得像就套一个模型
就算出一个结果来
那样的话是会很容易出大的错误的
所以我们一起来看一下
么
RCT
最重要的假设是什么
点个名
这个问题都很简单了
我们作为一个回顾
大家要注意一个登陆雨课堂
不登录雨课堂就点不了你的名了
来 **回答一下
我觉得RCT的最重要的就是
就是 basic
assumptions的
第二条
Di和outcome是完全独立的
对 你觉得DID呢
DID假设跟RCT假设有什么异同
我觉得DID最重要的假设是
短期内
是平行
实验组和对照组都是它们的趋势是平行的
什么趋势
随时间变化的趋势
对所有的outcome
在没有shock的情况下
它们随时间变化的趋势是一致的是吧
平行的
那么这个是跟RCT不一样
的额外的一个假设
它有没有跟RCT相同的假设呢
RCT你刚才提的就一点
最重要的就是asignment
跟 potential
outcome是要独立
对吧
DID符合这一条吗
Sorry
不一定符合
DID不符合吗
我想一想
想一想asighment就是分组
这些人他被分到哪一组
这个是
独立的独立于它的 potential
outcome的
这个
DID不符合不符合
符合
为什么符合
因为它一般是一个
突发的事件
作为一个外完全外生的变量来影响
而来区分它的实验组和对照组
所以这个外生就保证了什么
保证和outcome独立
对外甥就保证了
我们的这些样本
被分到哪一组
那么也是跟outcome是独立的是吧
所以这条它其实是用另外
一种方式来呈现的
但是这两个假设是不是一致的
是的
行
再请你再回答一条 RD来
而且是我们刚刚讲完的准实验
这个准实验的假设是什么
然后 RD的假设是什么
然后它跟 RCT和DID
的假设有什么异同
RD
是
首先它会有一个断点
第二天和24天不一定有
然后它会要求
只有treatment变量
在断点的地方是断开的
而其它的协变量都要求是连续的
然后它们有一个共同点是
影响treatment
在这里发生断点的
政策或者
外生性的规则
它也是有外生的,跟Yi独立的
说得非常好
也就是说在断点附近
那么这个人
被分到treatment
还是control
也认为是
分组的结果应该是跟它的
potential outcome是
独立的是吧
对
那么假设就跟RCT是
非常像的 是不是
但是它的区别就在于说
RCT它相当于是一个全局性的
分组
但是RDD是不是一个局部的分组
但是在一个非常小的带宽下
而且
它要同时满足几个条件才能够
得出这样的一个假设
是不是满足 是不是
包括刚才你前面说的
它的 forcing
variable是不是连续在断裂
附近连续等等
那么这些都
都满足它能够得出这样的一个
一个局部的
这样的一个实验的
一个建构是吧
好 谢谢周璐
回答得非常好
所以大家可以看到
我们学的三种实验设计
不论是实验还是准实验
那么它都属于实验设计
那么
是不是它们其实都遵照了
RCT黄金准则里面的
最关键的假设就是
这个随机分组它是跟potential
outcome是独立的是吧
只不过是它呈现的方式不一样
一个是
这种大的 policy shock
或者是disaster
带来的这样的一些
外在的强制的这样的一些改变
么RD它是这种
强制的游戏规则
强制的规则
在一个连续的
变量上
产生了断点
并且因为这样的一些独立性
连续性使得我们在断点附近构造一个
类似于RCT这样的一个实验条件
那么这个就是
RD
那么IV呢?
IV其实是
跟我们说过了
它不是一个实验设计
但是因为IV它能够
引入外生的variation
external
variation
exogenious
variation
使得 IV可以帮我们去解决
内生性问题
自选择问题
那么所以IV的假设最强的一
条就是它跟 residual是
不相关的 也它是外生的
那么
当然同时它必须跟我们要解决
的内生及时变量是强相关
并且只能通过
对内生解释变量的影响是影响y
所以这个是IV
大家都非常清楚了
好
那么我们今天就来讨论
PSM在这样的一个
causal inference家族里面
PSM也是一个非常
重要的一个模型
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM