当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 1.4 Conditional expectation function 1
回归的本质是什么呢
回归
其实就是在去估算一个什么
一个条件概率
是
因变量y
关于自变量x的一个条件概率
也就是说我们对如果没有x这个条件
没有x这样的一个additional
Information
我们对y最好的解释
最好的预测就是用它的均值来去做预测
也就是它的期望
那么
但是我给定了一个x
independent
variable
它在理论上和在实证上确实
对y有影响的时候
这个时候y关于x的一个条件概率
能够更好的帮我们来去对
对y做出预测
条件期望没错 就是条件期望
对条件期望
我说成条件概率了是吧
好 所以是纠错
好 我们来看一下
那么下面我们进入对
回归分析的一个更加详细的讨论里面
刚才是一个idea
是一个general idea
那么下面我们来讨论非常具体的
那么这给出了一个我们很熟悉的
一元的一个回归方程
这里 Yi是第i个
individual的在y上
的取值
xi是它的
x的取值
那么β0跟β1是我们的待估参数
那么μi是残差
那么这个是一个
一个非常标准的这样一个表述
那么残差它是均值为0
标准差为1
这样的一个
okay
那么给定上面那个式子
我们来算Y
关于x的条件期望
它其实是x的一个函数
大家想清楚
y关于x的条件期望是x的一个函数
β0加上β1x
这个没有问题吧
那么这个里面μi怎么消失的
μi怎么消失的
Ok μi的均值为0
还有
它的期望为0
对这个是很重要的
因为μI的期望为0
而且它是跟x怎么样
跟x不相关
给定这两个条件
么y关于x条件期望里面
有一项是μ关于x条件
期望才会被怎么样
被消掉 它等于0
那么这个是
很重要的
下面我们依然讨论条件期望的关系
为什么讨论它
要搞清楚到底在底层数据上
我们是怎么样从一个样本的数据
得出这样的一个非常综合的的
方程关系的
好
那么下面
我们会
用一些积分和向量的表示
那么一个条件期望方程
x y是一个向量
因为y是一列
但是它有比如说
有
yi是一个
如果我有k个
协变量
那么x1到xk它就是一列
那么这个是对于一个individual来讲
它就会有这样的一个值
那么
y关于x条件期望
就是这么来写的
没有什么问题
它是大家要记一要记住它
是关于x的一个方程
关于xi的一个方程
那么
xi是一个什么
xi是一个随机变量
xi也是个随机变量
只不过 xi是我们可以观测到
当然yi我们这里也是可以观测到
那么xi是一个随机变量
y
关于x的条件
期望函数
是x的一个函数
其实这个条件期望函数它本身也是一个
一个随机的 它并不是一个
固定的一个取值得出来的
Ok
那么我们知道怎么来算条件
期望,我们用的是条件概率
条件密度函数
如果y是一个
连续变量
那么它的分布是用概率
密度函数来去刻画的
那么
fy关于xi等于x的情况下的
这样的一个
概率密度函数
是y关于x的一个条件概率密度函数
那么所以我们想求
y关于xi在等于小x的时候的
条件期望的时候
我们就会套用这样的一个函数形式
它等于
t
乘以f
然后关于t
再求积分
那么这个里面
很重要的一点是什么
大家想到说
y的期望值等于什么
y的期望的函数
它其实是
用t
乘以这个ft
然后对t求积分
这个ft呢
y的
是y的概率密度函数
那么
这是求就对于连续变量求积分
求期望的这样的一个
一个方式
大家看
在这个里面t是什么
t是不是
在它的值域范围内
所能够取到的每一个值
它可能的取值 对不对
那么
t大家想想想想清楚
t是y的取值
是y所可能取到的每一个值
但是它这里是个连续变量
那么这个积分这里省略了
这肯定是
从y的最小值一直到y的最
大值在它值域范围之内
么t取遍每一个值
那么就是来对t求积分才
能够求出y的期望值
同样在这个方程里面也是一样的
那么这个里面只不过是说在外
的概率密度函数里面
我加上了x的条件
当然这个时候x条件是什么
它是xi是给定一个固定值
小x是固定值
大X是变量
那么
Xi我抽出来之后
它的观测值是小x
这个是固定住了
固定住之后我来看它关于它
y关于他的条件
概率密度函数还是对t求积分
这点是很重要的
就这个里面大家想到说是谁在变谁不变
哪一步它变
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM