当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 5.1 Introduction 1
我们开始今天的
讨论今天的讲课内容
regression
discontinuity相信
大家在
之前的预习作业里面对这些
基本概念有所了解
所以我们今天
所以我们今天还是有这么几个部分
第一个是对RD的
它的一个理念
它的逻辑的整体的讨论
第二个就是这个模型怎么建立起来
第三部分是怎么样去估算这里面的参数
第四个是专门针对模糊的断点回归
我们做一个讨论
再就是对于每一个模型
它的效度以及它的假设
如何去检验
那么我们来做一个讨论
所以这个大概是今天的内容
前面我可能会讲得快一点
因为大家都预习了一些最基础的知识
你们觉得有不懂的地方
可以随时打断我
方式大家都很熟悉了
我把弹幕也开开
那么包括用聊天区等等都可以
或者说你直接拿麦克来打断我
因为万一我要是没有看到文字的话
也可以用麦克来直接说话来直接提问
Ok
那么这张图是咱们的 causal
influence model里面
的 conceptual map
我们前面已经把RCT和
natural
experiment已经讨论完了
那么这个是实验
设计里面的随机实验
那么现在我们进入
quasi-experiment准
实验
准实验里面我们今天讨论的是 RD
那么我们过两周之后
我们会讨论
倾向分数配对法
这两种都属于准实验
什么叫准实验呢
准实验在观测数据上
来进行
以 RCT为黄金准则
来
构造了一个实验设计
这个叫准实验
它首先是没有做实验
不像RCT是真做了一个实验
是研究者自己设计的
natural experiment
是
政策变迁或者大自然设计的实验
它们都是真的做了实验了
那么进入quasi-
experiment就是我们没有
任何人去做这个实验
它是用的是观测数据
但是我们根据随机实验的这样的一个概念
我们去
虚拟了也好
或者说是去构造了也好
构造了一个这样的实验,就叫准实验
那么RD的最
它来处理什么事情呢
在咱们的教科书上
most harmless
econometrics上面写的非常的简洁
和清楚
RD它是专门研究
哪方面是规则决定的
treatment也就是说
在我们这个世界里
我们人给自己
各方面社会生产生活
设立了很多规则
那么这些规则是我们来去运行
的很多的重要的一些准则
那么规则就决定了一些人能够接受干预
一些人不能接受干预
那么这个就给我们提供了一个非常好的
一个实验的这么一个机会
因为规则是什么
规则是非常强制的
它不是以个人意志为转移的
因此 individuals
个体是不太可能去做自我选择
那么这个时候规则就给我们带来了什么
这种强制性就带来了
external
variation这种外部
的变动
那么就可以给我们打破自选择
提供机会,就是RD
它要处理的这一类的问题的特征
那么当然RD它包括fuzzy RD和sharp RD
我们先从最清晰明朗的sharp RD来开始
那么
看到这个分数大家可能都会非常有感触
这个分数就是我们
制定规则常用的一个依据
比如说高考
每一个同学都会有一个高考成绩
那么如果我们确定一条分数线
比如说600分
600分以上
就能上大学
600分以下就不能上大学
这个时候大家的考试成绩
考生的考试成绩
那么这个是一个连续的变量
那么在连续变量上加了一个规则
制定的一个门槛
叫分数线对吧
那么分数线以上的
就会获得treatment
分数线以下的不能获得
treatment
那么这种规则它就给我们
研究方面带来这种
外部的这种变动
否则的话我们说
想评价
是否上大学对于未来公司
的影响这样的问题
我们就会面临非常严重的自选择偏误
显然能力强的人他更容易考上大学
那么他能力强 他不上大学
可能他的工资本来也会更高
那么
这就很难解决
而且我们也很难就这种重大
的人生问题去做随机实验
这是很难的
那么这种规则就给我们带来这种外部性
大家可以想象
说考600分的人
跟考599分的人
大家认为在本质上
能力各个方面有没有
明显的差异
他往往是没有的是吧
那么没有什么明显的差异
那么一拨人上大学一拨人因为
这个规则没有上大学
那么这个就给我们带来了这种
构造实验的这种可能
也就是说背后的一个潜台词是什么呢
是自然是不会
随便跳跃的
它是连续的
那么我们在一个连续的自然的
状态下
设定了人为的强的规则
就带来了这种跳跃
那么这种跳跃
应该是规则分组
带来的
而不是连续的自然本身带来的
我们具体来看这样的一个例子
上面这张图是
比如说上大学的
概率
600分以下
上大学的概率怎么样
Reading
来找一支笔
600分
假设是我们的 cut up
point断点
600分以下上大学的概率为0
它是一条平行的一条等于0的
线
实际上600分以上
上大学的概率就为一
这就是强制的规则
这个就是一条
这样一个楼梯一样的这么一个曲线
那么对于下面这张图就是
potential
outcome就是说
其中下面这条线
这条线
这条线
是一个方程这
这个手段了 这是一个
那么上面这条线是另外一个方向
这条线是另外一个方程
那么下面这条线是如果大家都不上大学
那么它的potential
outcome沿着高考成绩
是什么
这是一个函数形式
上面一条线是所有的人说我都上大学
那么它的 potential
outcome沿着高考成绩来分布
这个是什么样子
而现实中
现实中怎么样
现实中我们就是在600分
这个地方断开了
对不对
600分这断开了
使得600分以下的人
他上不了大学
那么它的 potential
outcome我们能
观测到的它的outcome
换一个颜色
我们能观测到的就是这段,实线的对不对
原来这张图实线的
这是我们能观察到的
那么对于600分以上的学生
我们能观测到他全都上大学了
因此它就会沿着
上面这条曲线的这一部分
来去走
所以说就使得
本来是两条连续的 outcome
这个函数
它就也产生了一个跳跃
那么这个跳跃
我们认为上大学带来的影响
因为它是
纯外生的
它是由政策的强制性来
来提供的来做的分组
那么
最基本的
一个逻辑 它怎么样来
去设计研究的
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM