1.13 Maximum Likelihood Estimatio慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

同学是不是都学过极大似然估计法

你可以在聊天里面说一下

是不是学过极大似然估计法

学过 ok

讲了一点点

这样子

这一块在我们的教育学的

研究里面是非常常用的

因为很多时候我们的变量的特征就

决定了我们没有办法使用OLS

但是我们

并不是这门课的重点

我们不是讲回归

所以说

我们如果是在后面还有时间的话

比如说第15周

那周我没有排内容

那么如果大家感兴趣

我们会专门的再仔细的讲

给大家做一点点这个

导读

这里面最重要的有几种情况

第一个就是我们的自变

我们的因变量

是一个二元解释变量

二元变量

二元被解释变量

0和1

这个是一个选择模型

也就是说我们经常要分析人的行为决策

它的原因

这个时候y是一个01变量

就不符合OLS的假设

这个时候我们就要

不能用OLS而是用 probit或者

是logic model

用的是极大似然估计法

当然我们的选择可以不止两类

可以有多类

比如说有12345，5种选择

那种5种选择的话

它

这种选择可以有序

也可以无序

我们会给它不同的模型

极大似然估计法

就是说

它的逻辑是什么呢

我有100个样本

100个学生

那么每一个学生

比如说它的选择

我们不用那么复杂的

我们还是用这个成绩

每一个学生它比如说考试

它都会有它自己的一个分布

它可能都是以它的为均值

的一个正态分布

它这次可能考的是均值

下次考的是均值以上

再下次考试均值以下

这个都是很有可能的

那么

但是我采出来这个样本它就只有一个值

它是从它分布中抽的一个值

随机抽的一个值

极大似然估计法是说什么呢

如果要找到一组参数

使得这种参数能够最大化

我所观察到的样本

它出现的概率

这个就是极大似然估计法

它的逻辑

就是说既然我观察到这个样本了

比如说

第一个学生考了70 第二

让学生考了85

虽然它这些学生它是分别在

它们各自的成绩分布里面

以一定的概率

展现出这个成绩的

但是这个概率多少我不知道

我要求一组参数，待估参数

使得说这种参数下

那么我观察到这些学生分别考

这些分数的概率，联合概率

它是最大的

说的就是这个意思

所以就是极大似然估计法它有一组假设

假设我放在这里了这是很重要的

很重要就是i.i.d

i.i.d假设

independent独立同分布假设

就所有的observation

所有的样本所有的人

它们的分布是一样的

是互相独立的

这两个有非常重要的假设

那么这样的话我们就可以

构造联合概率密度函数

因为它们是独立的

所以它们的联合概率就等于

每个人的概率乘在一起

去把问题变得非常简单

这个是为什么独立性非常重要

在这里体现出来了

它们互相独立

但它们实际上是不是独立的

这个事情我们要单独的讨论

那么假设它满足独立性

它的联合概率密度函数就等于

每一个人的概率函数

概率密度函数相乘就可以了

而且它们是同样的分布形式

所以每一个人的函数形式是一样的

就使得它变得非常简单

那么这样我们就构造极大似然值

构造似然值

那么我们去最大化这个值

也是变成求极值的问题

这个是估算的这样的一个思路

你们感兴趣的话可以去看

我们后面争取在这

后面我们再去讲一下

那么一般是取对数来求解

因为这样会比较容易求出来

这里我想说的是什么

除了我们常用的

probit model跟

logic model之外

我们对这个表可能要有一个概念就是说

当我们的自变量跟因变量

分别是不同类型的变量的时候

比如说二元变量

连续变量

有序和无序的多元变量

那么我们应该去选择什么样的模型

对于你们后面去做具体的研究

是很重要的

要选择合适的模型

再者就是说在我们的数据里

它会有这种censored data

和truncated data

那么这两种情况出现的时候

我们要考虑说这时候就不能

用OLS，这张图简单说一下

这个图的上面这张图

它是一个

没有censored data

我们可以看到这个时候我们跑一个

回归跑一个OLS就可以了

但这种情况大家可以看到说

很多样本

它都是在到0的时候它就会出现这种情况

也就是说比如说家庭的教育支出

假设家庭教育支出

我们观测到的值都是0以上的

比如说

支出可不可以是负的其实是可以的

比如说它

借钱这可能是负的

但是我们会看到说家庭

教育支出到0的时候

它会出现一个

非常激烈的一个增加

在分布上

都集中在0了

这就是一个censored data

或者比如说我们有一个考试

大家知道考试最低分就

多少分就0分对不对

没人考到一个负分

但是考试的难度是有一个边界的

如果说考试本身比较难

很多人

它可能就是考试的量程比较窄

它量的是比如说是100分

到120分的学生的水平

如果这个能力只有70分的学生

它在这个上面它就只能得个

0分

但实际上如果你给它一个更简单的试卷

它可能还是得0分

这个时候就会出现censored这种现象

而这个时候如果我们不考虑

它的数据的特点的话

我们做的估算

就会有偏就是OLS，那么这时候我们要换成

这个极大似然估计

对我们的方程进行纠正

那么这个我们在第15周有时间的时候

再讨论一下

这个是大家可能会在遇到的

好

那么今天我们就算是

非常

囫囵吞枣的

回归

给复习了一下

无论大家之前学的有这么多扎实

我希望今天过去以后

我们对这些常见的问题

都有一个非常一致的看法

希望大家也能够认真的去

复习

1.13 Maximum Likelihood Estimatio在线视频

1.13 Maximum Likelihood Estimatio课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

1.13 Maximum Likelihood Estimatio笔记与讨论

也许你还感兴趣的课程: