当前课程知识点:大数据管理与挖掘 >  第7章 数据回归方法 >  7.2 多元回归 >  7.2 多元回归

返回《大数据管理与挖掘》慕课在线视频课程列表

7.2 多元回归在线视频

下一节:7.3 逐步回归

返回《大数据管理与挖掘》慕课在线视频列表

7.2 多元回归课程教案、知识点、字幕

欢迎回来

我们继续讲我们呢本章的第二节内容

多元回归

多元回归分析也称为复线性回归模型

,在这里面它研究一组自变量

如何直接影响一个因变量

如我们的下图所示

在这里面

自变量

在这里面是指独立自由变量

或独立自由自变量的变量

用变量X来表示

而我们的因变量

是假设指非独立的

受其它变量受影响的这种变量

我们呢用向量Y来表示

由于模型仅涉及一个因变量

所以多元线性回归分析

也称单变量线性回归模型

在这里面多元线形回归模型的

它的应用条件如我们下面所示

它包含三个部分内容

第一个就是这里面我们的相互关系之间

成为一种线形关系

第二就是各观测值之间相互独立

第三个就是说残值服从均值为零

方差为σ2的这个正态分布

它等于对方对于任意一个自变量X

它这个方组里面应该是

我们的Y均服从正态分布

而且它的方差为零

注意在这过程当中

虽然模型它的自变量

和因变量之间呈一种连续变量过程

但对自变量的类型来说

我们的自变量之间呈一种分布特征

特别是无条件的数据分布

在这里面

要转化为变量之间才能够进行分析

对于自变量是否存在一个正态的分布

还需要对我们的

广义线性回归模型进行分析和推广

多元线形回归模型的假设过程

如我们下面所示

它的两个步骤

第一个就是

我们的总体回归函数

在这里面遵循这样的一个过程

通过这个过程呢

我们可以构造我们的样本回归方程

大家可以看一下在这里面

多元回归模型过程当中

我们主要采用最小二乘估计

利用一元回归函数

类似计算这个过程使我们的最小二乘方法

可以得到总体参数

它的的估计量和它的残值量

在这里面虽然计算过程重复复杂一点

但用计算效率比较高一点

容易得到我们的计算结果

在多元回归过程当中

对回归系数的解释过程有所不同

具体过程呢如下所示

假设在这里面我们的变量

它遵循我们的回归系数的这个解释过程

在这里面我们的一组数据x

当我们的一组变量x不变动的情况下

我们的每一个x值所变动的单位

它遵循我们的变量y的平均变动过程

在多元回归过程当中

寻求一种

元组回归过程当中的一些基本假设条件

除此以外

还需要假设自变量之间

不存在完全的多重复的共线性

在这里面否则我们没办去求解

我们的多元回归模型

当然在这过程当中

完全回归模型

它的共线性的特征呢有个很好的解决方式

在这里面一个自变量

可以表示为其他自变量

或者说常项的线性回归

如下面的公式所示

接着呢

我们给大家讲讲

多元回归它的模型里面的假设检验

我们主要采用拟合函数

在这里面通过修正我们的决策系数

来估计我们的标准误差

接着呢

在这基础上

我们进行显著性检验

我们主要采取

F检验和t检验两种方式开展

在这里面

通过多元回归模型来决定我们的系数

我们同样可以用决定系数的方式

均衡多元回归模型中的拟合效果

在多元回归这过程当中

我们采用多重决则系数这种方式进行解决

我们假设我们的平方根

称为复相关系数

它在这个过程当中

通过p个自变量的

相关系数来进行决定我们的这个结果

在这基础上呢

进行我们的假设系数的修订

在多元回归过程当中

比较自变量个数

以及个数不同之间的拟合效果

我们采用了多使用修正的拟定系数

具体过程呢如下所示

同时呢

在多元线性回归模型过程当中

它估计标准误差

也是一种对误差结果的修正过程

在这里面

我们对误差结果进行一个修正和估计

具体过程如下所示

根据自变量他们之间的关系

以及我们预测因变量y时的平均预测误差

我们进行预测我们的误差结果

在多元回归过程当中

t检验和F检验的步骤为

我们的一元回归模型基本相似

通常在这里面我们的检验过程

如下面公式所示

而且我们t检验统计量

也可以如我们的右面这个公式所示

当然了在这里面还要注意一点

我们的F检验与t检验存在不等价性

当我们的零假设和我们的备选条件

假设呢遵循一个规律的时候呢

我们假定如下两个所示的假设过程

这里面至少一个不等于0

偏相关系数和我们复相关系数进行计算

在这里面

我首先给大家讲讲偏相关系数

在多个自变量的条件下

我们要预测我们的因变量

与某一个自变量的线形相关系

在这线性相关里面

首先把它的自变量对因变量的这个影响

首先我们要解释出来

然后在这基础上

再进行计算二者之间的相关系数

具体公式如下所示

我们的方差和协方差可以看到

第二个就是我们给大家解释的复相关系数

随机变量与我们的回归系数之间

存在一定的相关关系

具体方差的计算过程如下所示

这是我们讲解的第二节内容

大数据管理与挖掘课程列表:

第1章 课程概述

-第1章 教学目标

--第1章 教学目标

-1.1 大数据的基本概念

--1.1 大数据的基本概念

-1.2 大数据的演变过程

--1.2 大数据的演变过程

-1.3 大数据应用

--1.3 大数据应用

-1.4 大数据的处理模式

--1.4 大数据的处理模式

-1.5 大数据管理的关键技术

--1.5 大数据管理的关键技术

-第1章 作业

--第1章 作业

-第1章 讨论

--第1章 讨论

第2章 大数据融合

-第2章 教学目标

--第2章 教学目标

-2.1 大数据融合的概念

--2.1 大数据融合的概念

-2.2 大数据融合的方法论

--2.2 大数据融合的方法论

-2.3 数据融合技术

--2.3 数据融合技术

-2.4 知识融合技术

--2.4 知识融合技术

-2.5 大数据融合的驱动枢纽

--2.5 大数据融合的驱动枢纽

-2.6 小结

--2.6 小结

-第2章 作业

--第2章 作业

-第2章 讨论

--第2章 讨论

第3章 大数据存储

-第3章 教学目标

--第3章 教学目标

-3.1 大数据存储与管理方法

--3.1 大数据存储与管理方法

-3.2 基于新型存储的大数据管理

--3.2 基于新型存储的大数据管理

-3.3 大数据处理与存储一体化技术

--3.3 大数据处理与存储一体化技术

-3.4 小结

--3.4 小结

-第3章 作业

--第3章 作业

-第3章 讨论

--第3章 讨论

第4章 大数据分析

-第4章 教学目标

--第4章 教学目标

-4.1 大数据的实时分析

--4.1 大数据的实时分析

-4.2 大数据的交互式分析

--4.2 大数据的交互式分析

-4.3 云在线聚集

--4.3 云在线聚集

-4.4 大数据的智能分析

--4.4 大数据的智能分析

-4.5 小结

--4.5 小结

-第4章 作业

--第4章 作业

-第4章 讨论

--第4章 讨论

第5章 大数据隐私

-第5章 教学目标

--第5章 教学目标

-5.1 隐私保护技术

--5.1 隐私保护技术

-5.2 隐私保护技术的应用

--5.2 隐私保护技术的应用

-5.3 大数据隐私管理

--5.3 大数据隐私管理

-5.4 小结

--5.4 小结

-第5章 作业

--第5章 作业

-第5章 讨论

--第5章 讨论

第6章 大数据管理系统

-第6章 教学目标

--第6章 教学目标

-6.1 云计算 大数据基础平台与支撑技术

--6.1 云计算 大数据基础平台与支撑技术

-6.2 批数据与流数据管理系统

--6.2 批数据与流数据管理系统

-6.3 SQL NOSQL与NEWSQL系统

--6.3 SQL NOSQL与NEWSQL系统

-6.4 小结

--6.4 小结

-第6章 作业

--第6章 作业

-第6章 讨论

--第6章 讨论

第7章 数据回归方法

-第7章 教学目标

--第7章 教学目标

-7.1 一元回归

--7.1 一元回归

-7.2 多元回归

--7.2 多元回归

-7.3 逐步回归

--7.3 逐步回归

-7.4 Logistic回归

--7.4 Logistic回归

-7.5 应用实例-多因子选股模型的实现

--7.5 应用实例-多因子选股模型的实现

-7.6 小结

--7.6 小结

-第7章 作业

--第7章 作业

-第7章 讨论

--第7章 讨论

第8章 分类方法

-第8章 教学目标

--第8章 教学目标

-8.1 分类方法概要

--8.1 分类方法概要

-8.2 K-近邻(KNN)

--8.2 K-近邻(KNN)

-8.3 贝叶斯分类

--8.3 贝叶斯分类

-8.4 神经网络

--8.4 神经网络

-8.5 LOGISTIC分类

--8.5 LOGISTIC分类

-8.6 判别分析

--8.6 判别分析

-8.7 支持向量机(SVM)

--8.7 支持向量机(SVM)

-8.8 决策树

--8.8 决策树

-8.9 分类的评判

--8.9 分类的评判

-8.10 小结

--8.10 小结

-第8章 作业

--第8章 作业

-第8章 讨论

--第8章 讨论

第9章 聚类方法

-第9章 教学目标

--第9章 教学目标

-9.1 聚类方法概要

--9.1 聚类方法概要

-9.2 K-means方法

--9.2 K-means方法

-9.3 层次聚类

--9.3 层次聚类

-9.4 神经网络聚类

--9.4 神经网络聚类

-9.5 模糊C-均值(FCM)方法

--9.5 模糊C-均值(FCM)方法

-9.6 高斯混合聚类方法

--9.6 高斯混合聚类方法

-9.7 类别数的确定方法

--9.7 类别数的确定方法

-9.8 应用实例-股票聚类分池

--9.8 应用实例-股票聚类分池

-9.9 小结

--9.9 小结

-第9章 作业

--第9章 作业

-第9章 讨论

--第9章 讨论

第10章 预测方法

-第10章 教学目标

--第10章 教学目标

-10.1 预测方法概要

--10.1 预测方法概要

-10.2 灰色预测

--10.2 灰色预测

-10.3 马尔科夫预测

--10.3 马尔科夫预测

-10.4 实用实例-纺纱质量预测

--10.4 实用实例-纺纱质量预测

-10.5 小结

--10.5 小结

-第10章 作业

--第10章 作业

-第10章 讨论

--第10章 讨论

第11章 诊断方法

-第11章 教学目标

--第十一章 教学目标

-11.1 离群点诊断概要

--11.1 离群点诊断概要

-11.2 基于统计的离群点诊断

--11.2 基于统计的离群点诊断

-11.3 基于距离的离群点诊断

--11.3 基于距离的离群点诊断

-11.4 基于密度的离群点挖掘

--11.4 基于密度的离群点挖掘

-11.5 基于聚类的离群点挖掘

--11.5 基于聚类的离群点挖掘

-11.6 应用实例-纱线断点诊断

--11.6 应用实例-纱线断点诊断

-11.7 小结

--11.7 小结

-第11章 作业

--第11章 作业

第12章 大数据技术应用

-第12章 教学目标

--第12章 教学目标

-12.1 数字挖掘技术的应用

--12.1 数字挖掘技术的应用

-12.2 纺纱质量控制

--12.2 纺纱质量控制

-第12章 作业

--第12章 作业

-第12章 讨论

--第12章 讨论

7.2 多元回归笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。