5.2 Introduction 2慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

那么我们来举一个非常经典的例子

咱们也是教科书上用的这篇论文

那么这个是说班额的事

班额在全世界都是一个

争论了几十年的事情

那么我们都认为说小班额对于学生是

更好的对于学生的成长

现在我们国家还是有政策对吧

要尽量的减少班控制大班额等等

那么

班额小老师也高兴

学生也高兴

但是

小班额的成本怎么样

小班的成本是非常高的

也就是说

小班额的观念是什么

是增加老师的数量对不对

增加老师的数量就要怎么样

就要从财政拨款里多拿出

很多钱来给老师发工资

那么本身教师工资在教育财政

支出里面本身就是占大头的

如果我们再想缩小班额的话

就要再增加一批老师

那么财政支出

会大幅上升

那么因此小班额这个事听上去很简单

但是在财政上它的负担是很重的

因此我们就不得不考虑

我们要多花这么多的钱

来减小这个班额

有没有到底值不值就是说

白了这个钱花的值不值

那么我们就要了解小班额到底能不能

帮助学生有更好的发展

是不是

这就是一个非常重要的问题

那么咱们待会会详细的来讲

我们来举小班额的例子来看

或是怎么样来去做

那么大家想如果我们用观测数据

用观测数据

比如说我们会知道全国这么多个班

班都是多大

这个数据我们是可以

获得的

那么我们用每一个学生所在的班对不对

那么

来跑一个回归

是不是这样是不是可以

Outcome是什么呢

是这个班的学生的成绩的平均分

最关键的解释变量是什么

Key variable

of interest

这个班额，班级大小

我们是不是跑一个这样的回归

我们就能够确定

到底是大班额还是小班额

对于提高学生的学业成就更有帮助

我们能不能就这样做一下就可以了

大家觉得怎么样

主意

这个主意显然是有问题的是吧

我们同学预习了

但是还是希望大家

积极回答问题

我们主要是因为赶进度

可能给大家讨论的时间少一点

这个里面什么问题

就是说其实这个班额

它很有可能是一个

内生解释变量

也就是说它是一个自选择的变量

大家想

在一个理想状态下

如果所有的家长都希望自己的孩子

去到一个小班额的话

家长是不是会用脚投票

也就是说

它会帮助自己的孩子去选择

这种小班额的班级

是不是

那么这种小班额的班级可能

会面临更高的竞争

或者是更高的学费，在某些国家

那么这个是一种可能性

第二种什么

像中国的情况

往往是这个班它越好

这个学校越好

当它越想往里挤

使得这个班额怎么样就会变大是吧

我们会看到有一些

学校

它比如说所谓重点学校

它的学生的规模可能更大

因为所有人都想往里挤

那么在任何一个学校里面

可能某一个班相对比较好的班

所以比较好

可能老师质量比较好

口碑比较好然后等等

成绩比较好

学生成绩比较好

像这样的班它往往这个班额会更大

因为更多的家长想挤进去

所以说这些都是自选择问题

是因为我们无法观测到的一些原因

家长再去帮助孩子选择班额

那么这个时候

class size这个变量

就变成了一个内生解释变量

那么这个时候怎么样

我们简单的用观测数据跑一个

OLS的回归

得到的系数β1

它就是一个有偏的系数

它就不能够帮助我们回答班额到底

对学生的成绩有没有帮助

所以说

自选的问题无法

用OLS来解决我们这个班

额的这样的重要的命题

那么我们来看这个论文里面

是用了一个什么样的规则来

帮我们找到了外部的变动

并且帮助我们解决了这个问题

这个是以色列的迈蒙尼德法则

这个迈蒙尼德法则就是关于班额的规定

它是强制的

一个规定

那么它说什么呢

它就说规定以色列的这些班级

任何一个学校

如果它

从一个学生开始

它可以不断增长

当然如果这一个年级的

学生人数非常少的话

就一个班就可以了

从这个逻辑开始

当班级的学生

它超过40的时候

政府就强制要求学校

要再给年级增加一名老师

这样的话把

把这个班就拆成两个班

每个班就变成了

20个人和21个人

那么这两个班它再继续增长人数

如果两个班的人数都满到40

如果这时候又有学生转进来的话

那么

学校就必须再增加一名老师

这个就是迈蒙尼德法则

我们用一个

这个数据来看大家来看

这数据的左边这一列

左边一看这一列

这一列

比如说很多个学校

每个学校它在某一个年级有多少学生

那么显然它应该是一个连续的分布

有的学校规模小

它可能只有36个学生

有的学校规模多

它可能有81个学生

但是它是一个连续的分部年级的总人数

那么根据迈蒙尼的法则

对于40人以下的

这样的学校

它只要一个班就可以了

那么它班里的学生数

就是右边这一列

箭头这边过来对应的这些

数量

但是如果有一个学校

它的年级的人数是41人

按照迈蒙尼德法则

它就这么

它就怎么样

它就必须学校要再给它增加一个老师

那么让这41个人要分到2个班里面

那就是1个20个人，1个班21个人

那么如果这个人学校人年级人数继续增加

我们可以看到

它就是在这两个班里面就平均

的往里面分学生就可以了

那么这两个班都会

随着这个人数的增长

它都会基本同步的在增长

直到怎么样直到80

当这个年级有80个人的时候

它还是两个班

还是两个班每个班是多少人

每个班是40人

这是满了

按照迈蒙尼德的法则是满的

这时候如果再增加一个人

81个人的时候

就必须再增加一个老师

那么把这个班一共就这三个老师了

就平分成三个班

每个班27个人

那么然后再往下增加

这个就是迈蒙尼德法则

我们用一张这个图来画

横轴是年级人数

纵轴是每一个班的学生人数

可以看到迈蒙尼德法则其实

就是画出这么一条

锯齿状的

这么一条

线曲线

它是一个连续

连续的但是它是

并不光滑的一条曲线

这个就是规则带来的这种

外部的这种变动

好

关于迈蒙尼德法则大家有没有问题

大家可以看到

年级人数

是一个连续变量

自然是连续的

它本来就是连续分布的

但是规则给我们带来了跳动

那么规则就带来了这种外部性

那么外部行为会导致什么呢

导致我们每一个学生面临的

treatment就不一样了

这里的treatment是什么

是小班额大家看这是一样的

左边第一列是年级的人数

从36人开始看到46人

那么显然在40~41人的时候

我们发生了看到了一个变化

那么每个班的人数它就会从

40人变到20.5人

就统计来讲平均的20.5人

那么我也确实可以看到肉眼可看的

是什么

确实下面20 20.5人就小班了

它忽然就掉到小班了

它们的阅读成绩是73分

40人是大班

它们的阅读成绩是67分

确实有一个差异

那么这个地方我们先不关注这些细节

我们就可以看到说

确实当

年级人数从40变到41的时候

学生所在的班级的班额

一下子就从大班

落到了小班

也就是说规则

导致了

treatment

三板它的这种变化

那么这个就是断点回归所要利用

的这样的一种规则游戏规则

那么这个就是它的逻辑

那么

有了这样的一个规则之后

我们当然很高兴下面我们就应该是

来去看怎么样去得到这个结果

这个也是咱们的课本里面讨论的一个问题

我看在课前讨论的时候

有的同学对这张图还是有一些疑问

那么我们来看一下

这个点

这个

41人年级规模是41人的

这些学生

那么它的阅读成绩是在这儿

在这儿

那么

年级成绩是40人的

sorry

年级的学生规模是40人的这些学生

它们的成绩当然是这个点

当然就是39，38它会有

一个波动这样子过来

那么大家想

我们有这样的一个观察之后

我们想去估算

大班跟小班

给学生带来的成绩的差异

所谓的treatment

effect

它应该是什么

是吧

那么一个非常简单的想法

当然是这里标的 first

difference是吧

就是说

从40个人对应的点跟41人对应点的差

因为我们显然认为40人跟41人

它们离得更近更相似

但是这个显然是怎么样

这个显然它是有很多

limitation的

有很多局限

第一点局限是什么

大家觉得第一点局限是什么

我们用一个点

来去做估算

咱们统从统计上从定量分析来讲

它是不是

还是有很多风险的

因为观测数据也是有它的随机性的

是不是

我们用一个点来做估算

样本点非常少

它的精确度就会下降

这是一个

第二个

我们也确实看到为什么

它估算也不是很准确

如果我们看从36~41的话

36~40的话

它这个虚线

是类似一条拟合曲线

它其实是一定的斜率上升的

是不是

因此

40这个位置虽然很接近于41

但

其实我们想要的是不是

年级规模在41人的情况下

如果它依然是大班

那么它的学生的成绩是多少

我们要的是这个点

但空的这个点是不可观测的

也就是说

在

在这样的一个游戏规则下

政策的规定下

我们永远看不到

年级人数在41人的情况下

大班额的这种情况

我们只能看到小班额上面这个点对不对

所以说我们想要的空心的

我们用40这个点来代替

它们之间其实是有一个误差的

这个就是简单的做一个first

difference

它的问题

刚才说了有至少两点

所以我们就来看

那么我们应该怎么样来去

我说对不起打断您一下

想请问一个问题

如果我们搜集到足够多的班额

为40人的班级的数据的话

那么我们就可以说这个点

基本上是无偏估计的

那么在这个情况下是不是可以说

第一个问题就被回避掉了

是的

如果你有很多个点的话

如果这个是一个无偏估计它的标准差

标准误足够小的话

还是可以的

这个没有问题

好的了解了谢谢老师

但是第二个问题还是没有办法回避

所以我们还是需要看这个趋势

其实我们有足够大的样本量的话

对 **你说的很对

就是第二个问题

毕竟虽然我们说40个人跟

41人没有显著的区别

但是如果看到这样一个趋势的时候

我们还是认为它是有微弱的区别的

那么我们也要考虑到这样的一个

bias的问题是吧

好的了解了谢谢老师

好谢谢**

非常好

鼓励同学们直接打开麦克说话

5.2 Introduction 2在线视频

5.2 Introduction 2课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

5.2 Introduction 2笔记与讨论

也许你还感兴趣的课程: