5.13 RD workshop 2慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

那么同样

我们还可以画这个density

就是咱们上节课讲过我们

RD特别担心的就是

人们会因为提前知道了政策的规定

游戏规则

来操作自己的D

对不对

那么这个时候

我们就会认为它在D的

概率密度函数上

它的频数分布图上

就会出现跳跃

这个是我们

担心的问题

上节课我们举的例子是关于

低保这样的一个情况

那么这里我们就可以对每一个RD的分析

都来做这样一个density的刻画

14行命令就是来去刻画

了这个density

大家可以

自己画一下

因为没有设定带宽

所以它就会跑出三组

会跑出三组带宽的单词题

我们随便挑一个看一下

确实不同的带宽画出来density是不一样的

我们还是用一个带宽的来看

那么这个是一个带宽的设定下

density的情况

它是画了三个图

一个是对于整个样本我画

了一个density

这是上面的一条蓝线

然后在断点两侧分别单独的

画两个density

分别是红线和绿线

那么我们可以看到

这是一个什么样的分布

这是一个双峰分布对不对

双峰分布

那么

也就是说

在0附近的这种州是非常少的

什么意思就是说

态度不太鲜明的州在选举中态度不太鲜明

选票集中在50%上下

这种情况的州是非常少的

每一个州的态度都很鲜明

这个也确实符合现实

要么它就支持民主党

要么它就支持共和党

所以它会出现双峰

显然这个取负的它是支持的是共和党

那么

正的峰，它这一州它支持的是民主党

这个是符合现实的

也不好说

它只是一个manipulation

的结果

因为没有什么好选民没有什么必要

去manipulate

这是它们的一个整体的选举意向

但是这个做法是这样子的

大家想一下

除了我们用RD帮我们写好的

命令来去跑 density

你们自己如果是想去看一下

这个就是样本里的这些个体是不是

操纵了自己的

forcing variable

的取值

我们直接可以怎么样

我们是不是直接就可以对D做

一个频数分布图就可以了

是不是

所以大家你们自己来敲一下代码

这个是不再do file里面的

大家自己来看一下

我想看一下

这个D它的分布是什么样子的

我们其实就是很简单

我们 hist D就可以了对不对

我们就可以看到 D的频数分布图

这就出来了

那么显然这个图跟刚才的

这张图是完全一致的

它也是一个双峰是不是

它们

所以说其实你不需要用 RD

里面的写好的命令

你也可以

自己来去看它的density的情况

所以说

大家慢慢的要具备这种能力

有的时候一些命令是

我们可以自己来去做的

当然你要是能力强的话

你也可以自己写新的软件包出来

好这是关于检验 density

那么接下来我们来看一个什么呢

既然选择带宽

会影响到我们的估算的结果

我们就想做一个对于带宽的分析

就是取不同带宽

这个结果

到底会有什么样的变化

我们做一个更加形象的这样的分析

我们来看一下第16行命令

大家跑一下第16号命令

这个是第16方面的 option

它其实就是把三种带宽

下

我们估算的结果把它给画出来了

大家可以看到

一个带宽是0.29

两个带宽是0.59

半个带宽是0.15

大概这三个位置

那么红色的就是点估计

这个线段就是我们的95%的置信区间

等等这些值，也都画在y轴上了

我们可以看到

取不同的带宽

我们点估计的差异以及它对应的95%

置信区间的大小

就可以很好把它标出来对不对

这是一个比较

形象的一个做法

那么这种情况是我们取了三个带宽

我们还可以取更多的带宽

把图画得更加的

密实一点

大家看一下第17行

17行这个地方

看这个

命令

option我们在定义带宽的时候

mbw带宽

它是25

小括号25和300

什么意思呢

从25%个带宽

到三个带宽之间

我每隔25%个带宽

我取一次带宽的值

我来做一个RD

那么我就把这一系列的带宽下

RD的结果都把它画出来

这行命令的意思

大家跑一下第17行的命令

好

同学们是不是

跑出了像

就像啥

鱼骨是吧

跑出了这样的一个

图

那么这个就给我们提供了更多带宽下

我们的点估计跟区间估计

的这样的一个结果

当然你看到这张图的时候可能

如果不是

对这个结果还不是如果熟悉的话

或者对于一般的第一次

看到结果的读者来讲

它不知道哪一个是一个带宽

它要有一个参照

所以我们看一下第18行命令

18行命令加了一个ox

它就把一个带宽给标出来了

大家把18号命令跑一下

这个是第18行命令跑出来的结果

我们可以看到它在一个带宽0.29

带宽下标了一条红线

我们就可以清楚知道谁是一个带宽

那么其它的就是每隔

1/4个带宽

就做一次估计

那么你们通过这张图来看的话

你们有什么感受

对于

估算结果对于带宽的影响

大家有什么感受

就是它的当

但它带宽特别小的时候

它变动了就

非常大

然后好像

后面的之后好像差不太多

就是把它

把它带宽就拉得更大了

也就是说带宽增加以后

它的结果还是比较稳定的是不是

但是25%个带宽这个情况下

它的值跟其它的值的差别会大一些

是不是

对的

还有关于这个区间估计的精确度

我看一下

这个区间越大

是不是说明它的精确度越差

对不对因为它区间非常大

它没有办法定义一个更小的区间

那么大家你们陈军来看一下

我们随着带宽的增加

精确度是怎么变化的

带宽越大

它的精确度就看的是

精确度就是更大了

精确度提高了对不对

因为样本量提高了

那么肯定一开始带宽样本量是非常小的

所以大家看一下

25%个带宽的情况下

这个置信区间是非常大的

虽然它这个值看上去就effects

比较大

但是它精确度非常低

所以说

也没有给我们带来更多的信息

零是不是始终的处于我们

的置信区间里面的

所以说这就是为什么我们的结果

也没有办法显著地区别于零

好谢谢**

有没有同学还没有登陆雨科堂

你要登陆一下

这样的话就可以被点名

好

对于上面sharp RD

大家有没有什么问题

没有问题

老师

我想问一下

我想问一下默认的带宽是怎么样算出来的

我们自己可以选择

这个算法

如果你用RD命令的话是没有办法

因为这个软件包是作者写好的

它就用了一种算法

这个算法你去来用help RD

看一看它是怎么去引用的算法

你就可以找到它这个计算公式

但是这个并没有一个

最优的一个

而最后的带宽它也只是依据

了一个公式来算的

这个是

你要选择的话

你只能说在这个基础上

你选择几个带宽

就刚才我们用这种方式来调整

但是你说你换一个公式来算

那就要你自己去算

它RD它就不会再给你算出来了

好的谢谢老师

好下面我们来看fuzzy RD

因为这个数据本身它确实只是

一个sharp的RD的情况

因为美国选举是吧

不可能出现

fuzzy RD的情况

大家想一下这个就非常的

奇怪了

选票多的没有获胜

那么

在选举这种情况下还是很难发生的

所以它本身是一个sharp RD

那么我们做练习

我们就要去来构造一个fuzzy RD

也就是要产生一个

稍微内生一点的一个变量

那么现在

fuzzy RD这个模块

大家可以看到是从21行开始

一直到31行

其实主要是到

29行31

画图了

那么我们来看一下

这一块在干什么

现在我们把大家分到小组里

进行小组讨论

把每一行命令搞清楚

提示大家

要用help RD命令

以及你来看一下

23行它做了一个什么样的

计算

好不好

5.13 RD workshop 2在线视频

5.13 RD workshop 2课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

5.13 RD workshop 2笔记与讨论

也许你还感兴趣的课程: