当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 3.1 Introduction
好
同学们大家上午好
可以听到我的声音
我们今天高级定量
我们继续来探讨随机控制实验的研究设计
我之前也是跟大家这么来介绍过把工具变量学好
基本上这门课的三分之一的重要知识都涵盖了
今天把rct学明白呢
这门课的第二个三分之一的知识基本上就可以搞定了
那么剩下这几周因为很多都是rct的思想
并且一些具体的数据处理的问题
我们在iv和rct里面都会介绍到
所以说我觉得后面的这几讲虽然都非常重要
但是从知识的新颖程度来讲
合在一起可能构成最后的三分之一的知识
所以今天这堂课是非常重要的
我们同学有任何问题都可以随时来提问
再就是上一次也有同学反映说iv lecture之后
大家每一个人问一些问题
然后同学们来答疑
这个感觉非常好
因为你会发现有一些问题
自己并没有想到或者没有想明白
其他同学问出来了
并且解答清楚了
那么对我们大家都是非常受益的一件事情
所以我们继续坚持非常好的方法
但是课堂上大家有问题也欢迎你们随时提问
因为今天讲的东西是非常重要的
我们先简单的来去review一下
因果推断模型家族到底大概是什么样一个结构
我相信很多同学应该都了解过
那么接着我们就来讨论rct的研究的设计
以及他的一个基本估算方法
接下来我们讨论两个非常重要的专题
一个是crossover
一个是clustered groups
这两个问题非常重要
他也是我们从导论课进阶到高级课的进阶的一个重要的
环节
对这些专题问题的讨论
首先我们再简单的再去回顾一下
为什么我们关心因果关系
相对于相关关系
我们更关心因果关系
有没有同学愿意分享一下你的见解
哪位同学愿意分享一下
我们点个名
来
同学
分享一下
老师能听见吗
可以
就感觉因果关系和相关关系的话
相关关系更表面
而因果关系更本质是一种机制的问题
如果我们通过因果关系可以非常准确的得到因
怎么样的因可以得到什么样的果
但是相关关系的话可能就没有办法这么准确
他可能会根据其他的其他因素的变化而产生不一样的
相关
回答的非常好
谢谢mickey
确实是这样子
相关关系它其实是一个在数学上在统计上体现出来的一种
相关性
我们可以观察到两个现象同时发生
那么它就具有一个相关关系
但是它在机制上是不是有一个在机理上的实质性的关系
这个是不一定的
所以说也可以称为表面
也可以称为我们没有认识到问题的本质
那么当然在教育领域有很多问题非常复杂
我们不可能一下子就抽出这个本质
这也是为什么我们能容忍相关关系的存在
但本质上我们是希望能够得到这种机制性的机理性的这样
的一个关系
那么包括在我们政策研究领域
那么在这个政策研究领域
我们关心一个教育政策的效果
或者是一个教育改革的效果
或者是一个教育干预的效果
这个时候我们关心的就是一个因果关系
而不是简单的一个相关
所以说这个是非常重要的
当然了我们也经常讨论这个问题
从这学期开始我们有讨论这个问题
在教育领域确实我们更多看到的是一些非线性的
甚至是这种循环的因果关系
那么这个时候简单的线性的因果关系不足以去刻画更复杂
的这样的一个教育的过程
但是我们是从最简单的开始
那么把这个简单的讲清楚
也许我们慢慢的就有这样的一个更好的设计来去处理更
复杂的这样的一个因素之间的因果关系
那么今天就是一个非常重要的开始
那么这张图相信大家应该都见过
那么这个就是我们在因果推断模型或者说更广义的定量
分析里面
我们的金字塔的结构
那么在金字塔的最顶端就是rct随机控制实验
它被我们称为是 gold standard
of causal influence
也就是它是我们设计其他模型的一个重要的参考
那么今天我们讲的就是rct除了rct还有自然实验
那么自然实验我们下一个lecture会专门探讨这个
问题
那么它是因为自然界中或者说政策的变迁
产生了一些不可抗力的变化
给我们带来了这种外部性
然后带来了一些对照实验的契机
像这次疫情就属于这种不可抗的这样的一些灾难
那么疫情就会迫使人们改变社会的一些活动的组织方式
包括比如说我们的教学方式
那么这个就是一个外部的 variation
它就给我们带来了一个做实验的观测的这么一个机会
那么rct跟 natural experiment合
称为随机实验
natural experiment它也是随机的
rct是随机控制实验
是由研究者设计并且控制的
这样的实验
他们都是随机实验
那么在随机实验下面是
quasi-experiment
我们叫准实验研究
那么准实验研究它并不是一个真正做的随机实验
而是用观测数据来去建构了一个随机实验的一个set-up这样
的一个情况
也可能是模拟的
也可能是确实找到了一个局部的随机实验
那么从而还是以rct为参照
来开展一个实验设计实验研究
但是用的数据是观测数据研究者跟自然都没有去做这个
实验
我们这个学期会介绍两种方法
一个是rd一个是psm那么在后面几周都会专门的去
讨论
那么除此之外
我们只用observational data
用观测数据
也没有用任何的实验的思想那么来去做的分析
这个就叫非实验设计
大家注意到 quasi experiment它其实
也是实验设计
准实验也是一种实验设计
那么如果是我们什么都没有做实验
拿了观测数据
就跑了个回归出了个结果或者是等等
那么这个就属于非实验研究
非实验研究如果不能够很好地去证明它的满足相应的
ols的假设的话
是很难得出令人信服的结论
也不是不能就是说你要满足要求
所以这个是我们这个学期都会探讨的问题
大家想iv的方法是属于哪一类
你可以用你可以用聊天工具或者是也可以用弹幕
虽然我们统一的可以去来使用
聊天
iv是不是实验方法呢
有没有同学愿意回答一下iv是不是实验方法
iv是实验设计还是非实验设计
那么iv它是非实验设计是吧
它是用的观测数据
它没有做实验
它在整个的模型的 set up里面有同学回答了不是
实验方法
他在整个模型的set-up里面
他没有考虑任何的实验的这样的一个思想
但是iv确实是我们做因果推断的一个很重要的模型
对不对
所以并不是所有的因果推断模型都是实验方法
iv就不是那么这个是大家要分清楚
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM