当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 5.4 RD Estimation 1
好
下面我们就来看怎么样来去
估算这个模型里面的参数
最简单的就是线性估算线性回归
那么大家可以看这张图
是不是就是刚才我们这个公式
它的这样的一个
散点图加拟合曲线是吧
这样的一个形式它是线性的
我们可以看到这是断点
那么在断点的左侧
是一段线性函数
Y0i
断点右侧是Y1i的
拟合曲线
Y1i跟Y0i呢
它们的
函数唯一的差别就是ρ,是
个常数这么一个跳跃
它就是我们要的treatment
effect
对不对
这是最简单的形式
两边的斜率截距都是一样
唯一的就是这样的一个跳跃
那么这个是刚才说的 class
size里面具体的例子
这里面的数据它长成什么样子
你拿到这个数据它长它的
数据结构是什么样子的
有class id
对吧 有它的 achievement
这里是阅读成绩对吧
有
size size
第三列就是每一个年级的学生规模
它是一个连续变量
那么我们新建了一个变量是
把它给进行了中心化的点
我们的断点41
也就是说它离断点有多远
比如说变成了-5-2-1,0
那么0就是在断点这个位置
那么显然我们的 D在这里
是小班叫small
small等于1就是它被分到小班了
small等于0就是说学生被分到大班
显然是在断点以上
断点的右边
我们才会
看到
它这边的取值
small是等于1的
它分到了小班
那么之前都在大班里面的
好 这一页刚才讲讲过了
所以我们根据具体的例子
就可以写一个模型
这个地方我们是截取了一段非常小的带宽
36人到41人这样的一个带宽
我们来做这样的一个回归
我们写下这个方程
就是这样的方程
右边是 class size
中心化之后的class
size还有small
左边是我们的outcome
reading的成绩
它跟我们刚才说的一般化的这样
的一个方程形式是完全对应的
当然我们可以把中心化把它展开
让大家看得更清楚一点
你也能更熟悉这样的一个方程的变化
Ok
那么这种情况我们就会把
一个最形象简化的这样的一个
估算 把它套进去
也就是说当 size等于41
被分到小班
这个是我们可以观测到的
那么我们可以把它估值带进去
我们可以看到
最后得到的就是β0加β2
当然了下面这个值
公式二这个就是说
size还是41
已经到达了 cut point了
但是如果它被分到大班
它的outcome是多少是吧
如果这种情况存在的话
那么我们也带进去
带进去之后就是只剩下β0
那么β0的含义就出来了
β0就是说这个是我们观测不到的值
当然是中心化之后的β0的含义
当达到了这个断点
但是
我没有接受treatment
这时候的outcome是多少
就是β0
但我们求的我们要求的是什么
要求的是β2
β2是我们最感兴趣的
所以这还是回到刚才那张图对吧
我们因为建模进行了一个局部的线性回归
就能够帮助我们
预测这个值
因此就帮助我们估算出了β2
我们建模之后使得我们的对
treatment一般的估算更加
精确了
刚才我们讨论的问题就解决了
好
同学们有问题的话就可以随时提
所以这里再总结一下这里面
最重要的两个变量
第一个变量是forcing
variable
在这里
年级的人数
当然它可以中心化的点
一般 cut off point
第二个就是一个不连续的变量
一个二元变量
那么这个是我们的 treatment
status这里是small
它完全是由forcing
variable来决定的
那么它的参数它对应的系数
我们要估算的 treatment
effect
那么这个是论文里面得到的结果
我们就不多解释了
Csize对应的系数是0.12
small这是我们感兴趣的
treatment变量
它的系数是
5.12
微弱显着
10%水平上显着
也就是说确实小班
能够提高阅读成绩
提高大概5分这样子的一个概念
好 这是一个线性方程
那么我们在教科书上也看到
这张图
给我们举了三种情况
刚才我们讨论的是 panel
a是 linear的
线性的这种情况
panel B呢
是给了一个非线性方程
就是说
Y0i
关于x的条件期条件期望呢
是一个关于xi的非线性函数
这个没有关系
它非线性我们照样可以
估算出在断点的时候
这两段函数它之间的跳跃
那么这个跳跃
就是我们要的treatment
effect
这个是没有关系的
但是最麻烦的是什么
是三第三种情况什么
大家看一下
本来
这个数据就是说 Yi
关于x的条件
期望它是一个非线性函数
非线性函数的拟合曲线是这条虚线
我就不拿这个彩笔在画了
我怕涂了以后就看不清了
可以看到这个虚线
显然这个虚线的特点是什么
它在断点这有一个非常陡的上升曲线的
一个特点
但是如果我们错误的
把这个函数形式
假定成一个线性函数
我们就会
在断点附近分别得到两条线性的拟合曲线
就是实线
对不对
那么这个时候
我们就会错误地估算出一个跳跃
对不对
那么这个时候很致命的一个问题
本来人家是一个非线性的曲线
它是连续的
在断点间没有跳跃
是一个非常陡的上升就过来了
是这样子的一个
这个是一个正确的函数形式
但是因为我们错误的
把这个函数形式假定为线性函数
结果就估算出来一个跳跃
那么我们就以为我们得到
了一个trade
这种情况是非常危险的
那么这个就提醒我们在
RD的回归里面
方程形式
是非常重要的
那么后面我们就来看
非线性的工作也是
我们不能简单地假定呈线性
我们来看非线性的回归
这个会更加复杂一点
首先我们讨论的是参数回归参数估计
非线性显然它是由参数来定义的
才能是个非线性
Ok
那么首先还是看我们的Di
Di设定不变
那么这个时候我们就非常清晰地来去刻画
fx
这样的一个形式
fx是
Y关于x的条件
期望,是Y0
Yoi关于x的条件期望
这个是potential
outcome
Potential outcome
Yi关于xi的条件期望
那么它也是一个分段函数
分别在
Di=1和Di=0的情况下
我们设定两个函数形式
一个是f1 一个是f0
当然我们还是可以按照刚才说的
我们把它写成貌似是一个连续的
这样的一个形态
这里就出现了 Di
么Di的前面这一块
它就不再是一个常数了
不是一个待估参数了
而是两个函数的做差
是这样子的
那么这个是一样的
也就是说
Yi关于xi的条件期望
我们把它写成函数形式
fxi
它
等于
Yoi
关于x的条件期望就是f0xi
加上这串这串就是f1减去f0
所以
这两个任何一个都是它意思是一样的
它都帮我们定义了
ITE treatment
effect
然后在individual
对于个体来讲
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM