当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 5.8 Fuzzy RD 2
好 这是简单的形式
我们讨论一个复杂的形式
讨论复杂形式是什么呢
就是说下面
我们假设
g0跟g1的方程形态
它是可以不一样的是吧
它没有必要
一定要一样
这是一个很强的假设
这个时候我们就要分别写出
它的两侧
那么
这个fx的方程形态
刚才我们在讨论
非线性函数的参数估计的时候已经写过了
这是照搬过来的
我们就不再详细的说这件事情了
当然这样β*
它是
它是β1减β0,再
说一下
那么这个里面大家要注意
因为D是内生的对吧
D是一个自选择的变量
二元变量
所以
D
和x~的
多阶
各阶的多项式
各阶吧,x~的
各阶的形式
它们的交互项
也是内生的
它们作为一个独立就是每一个
比如说Di乘以xi~
它这个是作为一个变量来看待的交互项
所以说
我们这里面是有一组
内生解释变量
不是只有Di一个内生解释变量
这是为什么
我上面这个式子
之前要把它展开的原因就在这里会用到
从Di一直到 Di
乘以x~的p次方
全部是内生解释别量
那么既然我们有
p+1个内生解释变量
我们就至少需要多少个工具变量
是不是p+1个工具变量
所以我们对应的工具变量
是Ti
一直到 xp
x 的p次方 然后乘以Ti
我们是
对应有同样的这么一组工具变量
这点要注意
好 那么我们把这些东西带进去
我们来看
所以作为两阶段最小二乘法
我们先看最简单的就Di的
第一阶段的函数形式是什么样子的
那么
这个时候π它就不是一个常数了
它是两个方程之差
我们就要把它展开
展开形成这个样子
当然我们可以把小括号乘进去
这样的话我们能够
更清晰的
这个γ*当然也是
γ1,γ0的差了
我们就不再详细说了 对不对
我们把它乘开就是看到这个
工具变量都是在哪里
写成是从T
到x乘以T
1到x的p次方乘以t这些
都是我们的工具变量
好
那么这个就是关于内生解释变量D
它的一阶段的方程是什么样子的
同理
我们不是还有剩下的 p个内生解释变量
它们都是交互项
那么它们的方程
都是具有同样的方式形态
只不过是参数不一样
所以我们就应该在第一阶段
有p+1个
函数
好
那么当然我们每一个方程里面用到
的这些工具是不是一样的
首先是
原来二阶段的这些解释变量
对吧 x
到xp次方
再就是我们所有的工具变量
从T一直到xp次方乘以T
这个要注意
好 对这个有没有问题
没有问题 我们来看例子
看了例子我们就要做练习了
好
还是回到咱们迈蒙尼德法则
我们都很熟悉了 刚才已经讲过了
我们来去针对这样的一个具体的例子
来去建构
我们的模型
首先我们要把迈蒙尼德法则
它的函数形式要写出来
大家如果提前预习的话
应该比较清楚
那么它是这样的一个函数形态
es
第S个学校
给定年级的学生人数
那么
分母
这个ntt是取整取整数
(e s-1)÷40取整
然后加1
那么
它就等于什么
等于 m s c
m sc就是在第s个学校
第c个班级的班级规模
按照迈蒙尼的法则
它应该有的班级规模是多少
大家可以想 比如说
如果es等于40的话
40-1
是39
39÷40
取整是多少
取它的整数部分
0 对不对
那么0+1还是1
所以说它上面是
40人 40÷1
它的班额就是40 对吧
如果es等于41
yes 等于41的话 是不是
41-1
再除以40就等于1
一取整的话还是一
所以分母就变成了二
好
那么上面41÷2就是20.5
这个就是它按照规则它应该有的班级规模
是不是
所以这个公式就给了我们一个
迈蒙尼德法则
规定好的班额应该是什么样子
那么但是在现实中确实
我们会发现
很多学校
它可能是害怕成被惩罚
等到41个人的时候再分一个老师
万一分的不及时
那就是违规了
可能会害怕被惩罚
所以它往往在班级规模
没有到40人的时候
它就开始增加老师了
那么就使得这个班就开始下降了
那么这个就没有完全严格的
按照这个规则来去执行
所以我们看到
这张图
红点是标了是40的倍数
就在这个地方会出现断点
这是断点
虚线是迈蒙尼德法则
就是刚才咱们给的 m s c的公式
它画的这样一条折线
我们之前看到过了
实线
这个就是非常波动的实线
是真实的班额
真实的班额情况
我们可以看到确实真实的班额情况
虽然跟这个规则非常的接近
但是是不是并没有严格的
按照这个规则来执行
那么这个就是
fuzzy RD的一个情况
我们可以看到
前面这两个会更明显一点
后面会乱一点
所以这就是一个fuzzy RD
好 我们来看怎么来
来建立模型
这是我们的一般形式
我们根据一般形式
结合具体的例子
来建立模型
那么把内生解释变量把它描述清楚
留在这里 Yisc
在第s个学校
第c个班级的第i个学生的阅读
成绩 outcome
然后
再加上后面这一串
那么这一串
其中 pd它是一个控制变量
是proportion of
students with
disadvantaged
background
它是一个控制变量
我们不去管它
那么这段 es还记得这是我们的
forcing variable
对不对
es是
第 s个学校
它的给定年级的学生人数学生总数
这个就是我们的forcing
variable xi
所以说这个是关于es的p阶多项式式
这个就是我们的fxi
n s c是第s个学校
第c个班级的实际
班额大小
那么这个
当然我们可以把它改成大班
小班,我们也可以用实际班额
这个是
都可以的
那么它就是我们的内生解释变量
那么这时候ρ的系数直接跑OLS
回归它就是有偏的
好
那么关于这一页的字母
模型设定有没有问题
包括我们把 msc写在这了
虽然在这些
在这个公式里面暂时还没有出现msc
但是它就是我们说的Ti
按照规定应该具备的班级规模
当然这个地方msc和 nsc
都是实际班额了
但是它也是符合
符合我们的概念的
就是nsc
它是一个内生解释变量
msc是一个外生的
因为它是由规则制定的
它不是我们之前说的 D和T
D,T 是01变量
这个地方不是01变量
是班级的规模
好 同学们有没有问题
关于模型设定哪些哪个字母哪个概念没有
没有理解
为什么 因为你现在不问的话
待会马上就做题了
做题的时候
也可以问
好
大家没有问题的话
我们就来做题
这个题目非常清楚
根据上面的模型设定
和相关的一些变量
把两阶段最小二乘法的
第一阶段和第二阶段的回归方程
写出来
这个
简单的跑
OLS的这样的一个方程
那么这个里面显然 nsc
是一个内生解释变量
就刚才我们说过了
对于两阶段最小二乘法
第一阶段
其实就是把
e的 p阶多项式
放进来
然后再加上我们之前已经非常
清晰的界定的 msc对不对
msc是咱们的外生的工具
前面这块当然它的参数是有新的参数
那么第二阶段显然就是我们会算
出 n的拟合值代入第二阶段
那么这就完事了
这个很简单
好 大部分同学也都
也都答对了
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM