当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 5.2 Introduction 2
那么我们来举一个非常经典的例子
咱们也是教科书上用的这篇论文
那么这个是说班额的事
班额在全世界都是一个
争论了几十年的事情
那么我们都认为说小班额对于学生是
更好的对于学生的成长
现在我们国家还是有政策对吧
要尽量的减少班控制大班额等等
那么
班额小老师也高兴
学生也高兴
但是
小班额的成本怎么样
小班的成本是非常高的
也就是说
小班额的观念是什么
是增加老师的数量 对不对
增加老师的数量就要怎么样
就要从财政拨款里多拿出
很多钱来给老师发工资
那么本身教师工资在教育财政
支出里面本身就是占大头的
如果我们再想缩小班额的话
就要再增加一批老师
那么财政支出
会大幅上升
那么因此小班额这个事听上去很简单
但是在财政上它的负担是很重的
因此我们就不得不考虑
我们要多花这么多的钱
来减小这个班额
有没有到底值不值就是说
白了这个钱花的值不值
那么我们就要了解小班额到底能不能
帮助学生有更好的发展
是不是
这就是一个非常重要的问题
那么咱们待会会详细的来讲
我们来举小班额的例子来看
或是怎么样来去做
那么大家想如果我们用观测数据
用观测数据
比如说我们会知道全国这么多个班
班都是多大
这个数据我们是可以
获得的
那么我们用每一个学生所在的班对不对
那么
来跑一个回归
是不是这样 是不是可以
Outcome是什么呢
是这个班的学生的成绩的平均分
最关键的解释变量是什么
Key variable
of interest
这个班额,班级大小
我们是不是跑一个这样的回归
我们就能够确定
到底是大班额还是小班额
对于提高学生的学业成就更有帮助
我们能不能就这样做一下就可以了
大家觉得怎么样
主意
这个主意显然是有问题的 是吧
我们同学预习了
但是还是希望大家
积极回答问题
我们主要是因为赶进度
可能给大家讨论的时间少一点
这个里面什么问题
就是说其实这个班额
它很有可能是一个
内生解释变量
也就是说它是一个自选择的变量
大家想
在一个理想状态下
如果所有的家长都希望自己的孩子
去到一个小班额的话
家长是不是会用脚投票
也就是说
它会帮助自己的孩子去选择
这种小班额的班级
是不是
那么这种小班额的班级可能
会面临更高的竞争
或者是更高的学费,在某些国家
那么这个是一种可能性
第二种什么
像中国的情况
往往是这个班它越好
这个学校越好
当它越想往里挤
使得这个班额怎么样就会变大是吧
我们会看到有一些
学校
它比如说所谓重点学校
它的学生的规模可能更大
因为所有人都想往里挤
那么在任何一个学校里面
可能某一个班相对比较好的班
所以比较好
可能老师质量比较好
口碑比较好 然后等等
成绩比较好
学生成绩比较好
像这样的班它往往这个班额会更大
因为更多的家长想挤进去
所以说这些都是自选择问题
是因为我们无法观测到的一些原因
家长再去帮助孩子选择班额
那么这个时候
class size这个变量
就变成了一个内生解释变量
那么这个时候怎么样
我们简单的用观测数据跑一个
OLS的回归
得到的系数β1
它就是一个有偏的系数
它就不能够帮助我们回答班额到底
对学生的成绩有没有帮助
所以说
自选的问题无法
用OLS来解决我们这个班
额的这样的重要的命题
那么我们来看这个论文里面
是用了一个什么样的规则来
帮我们找到了外部的变动
并且帮助我们解决了这个问题
这个是以色列的迈蒙尼德法则
这个迈蒙尼德法则就是关于班额的规定
它是强制的
一个规定
那么它说什么呢
它就说规定以色列的这些班级
任何一个学校
如果它
从一个学生开始
它可以不断增长
当然如果这一个年级的
学生人数非常少的话
就一个班就可以了
从这个逻辑开始
当班级的学生
它超过40的时候
政府就强制要求学校
要再给年级增加一名老师
这样的话把
把这个班就拆成两个班
每个班就变成了
20个人和21个人
那么这两个班它再继续增长人数
如果两个班的人数都满到40
如果这时候又有学生转进来的话
那么
学校就必须再增加一名老师
这个就是迈蒙尼德法则
我们用一个
这个数据来看 大家来看
这数据的左边这一列
左边一看这一列
这一列
比如说很多个学校
每个学校它在某一个年级有多少学生
那么显然它应该是一个连续的分布
有的学校规模小
它可能只有36个学生
有的学校规模多
它可能有81个学生
但是它是一个连续的分部年级的总人数
那么根据迈蒙尼的法则
对于40人以下的
这样的学校
它只要一个班就可以了
那么它班里的学生数
就是右边这一列
箭头这边过来对应的这些
数量
但是如果有一个学校
它的年级的人数是41人
按照迈蒙尼德法则
它就这么
它就怎么样
它就必须学校要再给它增加一个老师
那么让这41个人要分到2个班里面
那就是1个20个人,1个班21个人
那么如果这个人学校人年级人数继续增加
我们可以看到
它就是在这两个班里面就平均
的往里面分学生就可以了
那么这两个班都会
随着这个人数的增长
它都会基本同步的在增长
直到怎么样 直到80
当这个年级有80个人的时候
它还是两个班
还是两个班 每个班是多少人
每个班是40人
这是满了
按照迈蒙尼德的法则是满的
这时候如果再增加一个人
81个人的时候
就必须再增加一个老师
那么把这个班一共就这三个老师了
就平分成三个班
每个班27个人
那么然后再往下增加
这个就是迈蒙尼德法则
我们用一张这个图来画
横轴是年级人数
纵轴是每一个班的学生人数
可以看到迈蒙尼德法则其实
就是画出这么一条
锯齿状的
这么一条
线曲线
它是一个连续
连续的 但是它是
并不光滑的一条曲线
这个就是规则带来的这种
外部的这种变动
好
关于迈蒙尼德法则大家有没有问题
大家可以看到
年级人数
是一个连续变量
自然是连续的
它本来就是连续分布的
但是规则给我们带来了跳动
那么规则就带来了这种外部性
那么外部行为会导致什么呢
导致我们每一个学生面临的
treatment就不一样了
这里的treatment是什么
是小班额 大家看这是一样的
左边第一列是年级的人数
从36人开始看到46人
那么显然在40~41人的时候
我们发生了看到了一个变化
那么每个班的人数它就会从
40人变到20.5人
就统计来讲平均的20.5人
那么我也确实可以看到肉眼可看的
是什么
确实下面20 20.5人就小班了
它忽然就掉到小班了
它们的阅读成绩是73分
40人是大班
它们的阅读成绩是67分
确实有一个差异
那么这个地方我们先不关注这些细节
我们就可以看到说
确实当
年级人数从40变到41的时候
学生所在的班级的班额
一下子就从大班
落到了小班
也就是说规则
导致了
treatment
三板它的这种变化
那么这个就是断点回归所要利用
的这样的一种规则游戏规则
那么这个就是它的逻辑
Ok
那么
有了这样的一个规则之后
我们当然很高兴下面我们就应该是
来去看怎么样去得到这个结果
这个也是咱们的课本里面讨论的一个问题
我看在课前讨论的时候
有的同学对这张图还是有一些疑问
那么我们来看一下
这个点
这个
41人年级规模是41人的
这些学生
那么它的阅读成绩是在这儿
在这儿
那么
年级成绩是40人的
sorry
年级的学生规模是40人的这些学生
它们的成绩当然是这个点
当然就是39,38它会有
一个波动这样子过来
那么大家想
我们有这样的一个观察之后
我们想去估算
大班跟小班
给学生带来的成绩的差异
所谓的treatment
effect
它应该是什么
是吧
那么一个非常简单的想法
当然是这里标的 first
difference是吧
就是说
从40个人对应的点跟41人对应点的差
因为我们显然认为40人跟41人
它们离得更近更相似
但是这个显然是怎么样
这个显然它是有很多
limitation的
有很多局限
第一点局限是什么
大家觉得第一点局限是什么
我们用一个点
来去做估算
咱们统从统计上从定量分析来讲
它是不是
还是有很多风险的
因为观测数据也是有它的随机性的
是不是
我们用一个点来做估算
样本点非常少
它的精确度就会下降
这是一个
第二个
我们也确实看到为什么
它估算也不是很准确
如果我们看从36~41的话
36~40的话
它这个虚线
是类似一条拟合曲线
它其实是一定的斜率上升的
是不是
因此
40这个位置虽然很接近于41
但
其实我们想要的是不是
年级规模在41人的情况下
如果它依然是大班
那么它的学生的成绩是多少
我们要的是这个点
但空的这个点是不可观测的
也就是说
在
在这样的一个游戏规则下
政策的规定下
我们永远看不到
年级人数在41人的情况下
大班额的这种情况
我们只能看到小班额上面这个点对不对
所以说我们想要的空心的
我们用40这个点来代替
它们之间其实是有一个误差的
这个就是简单的做一个first
difference
它的问题
刚才说了有至少两点
所以我们就来看
那么我们应该怎么样来去
我说对不起 打断您一下
想请问一个问题
如果我们搜集到足够多的班额
为40人的班级的数据的话
那么我们就可以说这个点
基本上是无偏估计的
那么在这个情况下是不是可以说
第一个问题就被回避掉了
是的
如果你有很多个点的话
如果这个是一个无偏估计它的标准差
标准误足够小的话
还是可以的
这个没有问题
好的 了解了 谢谢老师
但是第二个问题还是没有办法回避
所以我们还是需要看这个趋势
其实我们有足够大的样本量的话
对 **你说的很对
就是第二个问题
毕竟虽然我们说40个人跟
41人没有显著的区别
但是如果看到这样一个趋势的时候
我们还是认为它是有微弱的区别的
那么我们也要考虑到这样的一个
bias的问题是吧
好的 了解了 谢谢老师
好 谢谢**
非常好
鼓励同学们直接打开麦克说话
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM