当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 1.13 Maximum Likelihood Estimatio
同学是不是都学过极大似然估计法
你可以在聊天里面说一下
是不是学过极大似然估计法
学过 ok
讲了一点点
Ok
这样子
这一块在我们的教育学的
研究里面是非常常用的
因为很多时候我们的变量的特征就
决定了我们没有办法使用OLS
但是我们
并不是这门课的重点
我们不是讲回归
所以说
我们如果是在后面还有时间的话
比如说第15周
那周我没有排内容
那么如果大家感兴趣
我们会专门的再仔细的讲
给大家做一点点这个
导读
这里面最重要的有几种情况
第一个就是我们的自变
我们的因变量
是一个二元解释变量
二元变量
二元被解释变量
0和1
这个是一个选择模型
也就是说我们经常要分析人的行为决策
它的原因
这个时候y是一个01变量
就不符合OLS的假设
这个时候我们就要
不能用OLS而是用 probit或者
是logic model
用的是极大似然估计法
当然我们的选择可以不止两类
可以有多类
比如说有12345,5种选择
那种5种选择的话
它
这种选择可以有序
也可以无序
我们会给它不同的模型
极大似然估计法
就是说
它的逻辑是什么呢
我有100个样本
100个学生
那么每一个学生
比如说它的选择
我们不用那么复杂的
我们还是用这个成绩
每一个学生它比如说考试
它都会有它自己的一个分布
它可能都是以它的为均值
的一个正态分布
它这次可能考的是均值
下次考的是均值以上
再下次考试均值以下
这个都是很有可能的
那么
但是我采出来这个样本它就只有一个值
它是从它分布中抽的一个值
随机抽的一个值
极大似然估计法是说什么呢
如果要找到一组参数
使得这种参数能够最大化
我所观察到的样本
它出现的概率
这个就是极大似然估计法
它的逻辑
就是说既然我观察到这个样本了
比如说
第一个学生考了70 第二
让学生考了85
虽然它这些学生它是分别在
它们各自的成绩分布里面
以一定的概率
展现出这个成绩的
但是这个概率多少我不知道
我要求一组参数,待估参数
使得说这种参数下
那么我观察到这些学生分别考
这些分数的概率,联合概率
它是最大的
*
说的就是这个意思
所以就是极大似然估计法它有一组假设
假设我放在这里了 这是很重要的
很重要就是i.i.d
i.i.d假设
independent独 立同分布假设
就所有的observation
所有的样本 所有的人
它们的分布是一样的
是互相独立的
这两个有非常重要的假设
那么这样的话我们就可以
构造联合概率密度函数
因为它们是独立的
所以它们的联合概率就等于
每个人的概率乘在一起
去把问题变得非常简单
这个是为什么独立性非常重要
在这里体现出来了
它们互相独立
但它们实际上是不是独立的
这个事情我们要单独的讨论
那么假设它满足独立性
它的联合概率密度函数就等于
每一个人的概率函数
概率密度函数相乘就可以了
而且它们是同样的分布形式
所以每一个人的函数形式是一样的
就使得它变得非常简单
那么这样我们就构造极大似然值
构造似然值
那么我们去最大化这个值
也是变成求极值的问题
这个是估算的这样的一个思路
你们感兴趣的话可以去看
我们后面争取在这
后面我们再去讲一下
那么一般是取对数来求解
因为这样会比较容易求出来
这里我想说的是什么
除了我们常用的
probit model跟
logic model之外
我们对这个表可能要有一个概念就是说
当我们的自变量跟因变量
分别是不同类型的变量的时候
比如说二元变量
连续变量
有序和无序的多元变量
那么我们应该去选择什么样的模型
对于你们后面去做具体的研究
是很重要的
要选择合适的模型
再者就是说在我们的数据里
它会有这种censored data
和truncated data
那么这两种情况出现的时候
我们要考虑说这时候就不能
用OLS,这张图简单说一下
这个图的上面这张图
它是一个
没有censored data
我们可以看到这个时候我们跑一个
回归跑一个OLS就可以了
但这种情况大家可以看到说
很多样本
它都是在到0的时候它就会出现这种情况
也就是说比如说家庭的教育支出
假设家庭教育支出
我们观测到的值都是0以上的
比如说
支出可不可以是负的 其实是可以的
比如说它
借钱这可能是负的
但是我们会看到说家庭
教育支出到0的时候
它会出现一个
非常激烈的一个增加
在分布上
都集中在0了
这就是一个censored data
或者比如说我们有一个考试
大家知道考试最低分就
多少分就0分对不对
没人考到一个负分
但是考试的难度是有一个边界的
如果说考试本身比较难
很多人
它可能就是考试的量程比较窄
它量的是比如说是100分
到120分的学生的水平
如果这个能力只有70分的学生
它在这个上面它就只能得个
0分
但实际上如果你给它一个更简单的试卷
它可能还是得0分
这个时候就会出现censored这种现象
而这个时候如果我们不考虑
它的数据的特点的话
我们做的估算
就会有偏就是OLS,那么这时候我们要换成
这个极大似然估计
对我们的方程进行纠正
那么这个我们在第15周有时间的时候
再讨论一下
这个是大家可能会在遇到的
好
那么今天我们就算是
非常
囫囵吞枣的
回归
给复习了一下
无论大家之前学的有这么多扎实
我希望今天过去以后
我们对这些常见的问题
都有一个非常一致的看法
希望大家也能够认真的去
复习
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM