5.4 RD Estimation 1慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

好

下面我们就来看怎么样来去

估算这个模型里面的参数

最简单的就是线性估算线性回归

那么大家可以看这张图

是不是就是刚才我们这个公式

它的这样的一个

散点图加拟合曲线是吧

这样的一个形式它是线性的

我们可以看到这是断点

那么在断点的左侧

是一段线性函数

Y0i

断点右侧是Y1i的

拟合曲线

Y1i跟Y0i呢

它们的

函数唯一的差别就是ρ，是

个常数这么一个跳跃

它就是我们要的treatment

effect

对不对

这是最简单的形式

两边的斜率截距都是一样

唯一的就是这样的一个跳跃

那么这个是刚才说的 class

size里面具体的例子

这里面的数据它长成什么样子

你拿到这个数据它长它的

数据结构是什么样子的

有class id

对吧有它的 achievement

这里是阅读成绩对吧

有

size size

第三列就是每一个年级的学生规模

它是一个连续变量

那么我们新建了一个变量是

把它给进行了中心化的点

我们的断点41

也就是说它离断点有多远

比如说变成了-5-2-1,0

那么0就是在断点这个位置

那么显然我们的 D在这里

是小班叫small

small等于1就是它被分到小班了

small等于0就是说学生被分到大班

显然是在断点以上

断点的右边

我们才会

看到

它这边的取值

small是等于1的

它分到了小班

那么之前都在大班里面的

好这一页刚才讲讲过了

所以我们根据具体的例子

就可以写一个模型

这个地方我们是截取了一段非常小的带宽

36人到41人这样的一个带宽

我们来做这样的一个回归

我们写下这个方程

就是这样的方程

右边是 class size

中心化之后的class

size还有small

左边是我们的outcome

reading的成绩

它跟我们刚才说的一般化的这样

的一个方程形式是完全对应的

当然我们可以把中心化把它展开

让大家看得更清楚一点

你也能更熟悉这样的一个方程的变化

那么这种情况我们就会把

一个最形象简化的这样的一个

估算把它套进去

也就是说当 size等于41

被分到小班

这个是我们可以观测到的

那么我们可以把它估值带进去

我们可以看到

最后得到的就是β0加β2

当然了下面这个值

公式二这个就是说

size还是41

已经到达了 cut point了

但是如果它被分到大班

它的outcome是多少是吧

如果这种情况存在的话

那么我们也带进去

带进去之后就是只剩下β0

那么β0的含义就出来了

β0就是说这个是我们观测不到的值

当然是中心化之后的β0的含义

当达到了这个断点

但是

我没有接受treatment

这时候的outcome是多少

就是β0

但我们求的我们要求的是什么

要求的是β2

β2是我们最感兴趣的

所以这还是回到刚才那张图对吧

我们因为建模进行了一个局部的线性回归

就能够帮助我们

预测这个值

因此就帮助我们估算出了β2

我们建模之后使得我们的对

treatment一般的估算更加

精确了

刚才我们讨论的问题就解决了

好

同学们有问题的话就可以随时提

所以这里再总结一下这里面

最重要的两个变量

第一个变量是forcing

variable

在这里

年级的人数

当然它可以中心化的点

一般 cut off point

第二个就是一个不连续的变量

一个二元变量

那么这个是我们的 treatment

status这里是small

它完全是由forcing

variable来决定的

那么它的参数它对应的系数

我们要估算的 treatment

effect

那么这个是论文里面得到的结果

我们就不多解释了

Csize对应的系数是0.12

small这是我们感兴趣的

treatment变量

它的系数是

5.12

微弱显着

10%水平上显着

也就是说确实小班

能够提高阅读成绩

提高大概5分这样子的一个概念

好这是一个线性方程

那么我们在教科书上也看到

这张图

给我们举了三种情况

刚才我们讨论的是 panel

a是 linear的

线性的这种情况

panel B呢

是给了一个非线性方程

就是说

Y0i

关于x的条件期条件期望呢

是一个关于xi的非线性函数

这个没有关系

它非线性我们照样可以

估算出在断点的时候

这两段函数它之间的跳跃

那么这个跳跃

就是我们要的treatment

effect

这个是没有关系的

但是最麻烦的是什么

是三第三种情况什么

大家看一下

本来

这个数据就是说 Yi

关于x的条件

期望它是一个非线性函数

非线性函数的拟合曲线是这条虚线

我就不拿这个彩笔在画了

我怕涂了以后就看不清了

可以看到这个虚线

显然这个虚线的特点是什么

它在断点这有一个非常陡的上升曲线的

一个特点

但是如果我们错误的

把这个函数形式

假定成一个线性函数

我们就会

在断点附近分别得到两条线性的拟合曲线

就是实线

对不对

那么这个时候

我们就会错误地估算出一个跳跃

对不对

那么这个时候很致命的一个问题

本来人家是一个非线性的曲线

它是连续的

在断点间没有跳跃

是一个非常陡的上升就过来了

是这样子的一个

这个是一个正确的函数形式

但是因为我们错误的

把这个函数形式假定为线性函数

结果就估算出来一个跳跃

那么我们就以为我们得到

了一个trade

这种情况是非常危险的

那么这个就提醒我们在

RD的回归里面

方程形式

是非常重要的

那么后面我们就来看

非线性的工作也是

我们不能简单地假定呈线性

我们来看非线性的回归

这个会更加复杂一点

首先我们讨论的是参数回归参数估计

非线性显然它是由参数来定义的

才能是个非线性

那么首先还是看我们的Di

Di设定不变

那么这个时候我们就非常清晰地来去刻画

这样的一个形式

fx是

Y关于x的条件

期望，是Y0

Yoi关于x的条件期望

这个是potential

outcome

Potential outcome

Yi关于xi的条件期望

那么它也是一个分段函数

分别在

Di=1和Di=0的情况下

我们设定两个函数形式

一个是f1 一个是f0

当然我们还是可以按照刚才说的

我们把它写成貌似是一个连续的

这样的一个形态

这里就出现了 Di

么Di的前面这一块

它就不再是一个常数了

不是一个待估参数了

而是两个函数的做差

是这样子的

那么这个是一样的

也就是说

Yi关于xi的条件期望

我们把它写成函数形式

fxi

它

等于

Yoi

关于x的条件期望就是f0xi

加上这串这串就是f1减去f0

所以

这两个任何一个都是它意思是一样的

它都帮我们定义了

ITE treatment

effect

然后在individual

对于个体来讲

5.4 RD Estimation 1在线视频

5.4 RD Estimation 1课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

5.4 RD Estimation 1笔记与讨论

也许你还感兴趣的课程: