当前课程知识点:数据挖掘 >  第5章 回归分析 >  5.1 回归分析的基本概念 >  5.1 回归分析的基本概念

返回《数据挖掘》慕课在线视频课程列表

5.1 回归分析的基本概念在线视频

下一节:回归分析的基本概念

返回《数据挖掘》慕课在线视频列表

5.1 回归分析的基本概念课程教案、知识点、字幕

回归分析是使用最为广泛的统计学分支

在质量管理、市场营销

宏观经济管理等领域都有非常广泛的应用

本章介绍一元线性回归、多元线性回归、多项式回归

这三种回归方法应用非常广泛

通过本章的学习

可以掌握基本的回归分析原理及应用方法

回归分析(Regression Analysis)是确定两种

或两种以上变量间相互依赖的定量关系的

一种统计分析方法

应用很广泛

回归分析按照涉及的变量的多少

分为一元回归分析和多元回归分析

按照自变量和因变量之间的关系类型

可分为线性回归分析和非线性回归分析

如果在回归分析中

只包括一个自变量和一个因变量

且二者的关系可用一条直线近似表示

这种回归分析称为一元线性回归分析

如果回归分析中包括两个或两个以上的自变量

且自变量之间存在线性相关

则称为多元线性回归分析

回归分析主要解决两个问题

一是确定几个变量之间是否存在相关关系

如果存在

找出它们之间适当的数学表达式

二是根据一个或几个变量的值

预测或控制另一个或几个变量的值

且要估计这种控制

或预测可以达到何种精确度

在经济管理和其他领域中

人们经常需要研究两个

或多个变量(现象)

之间的相互(因果)关系

并使用数学模型来加以描述和解释

例如

商品销售量与价格间的关系

确定性关系是指当一些变量的值确定以后

另一些变量的值也随之完全确定的关系

这些变量间的关系完全是已知的

变量之间的关系可以用函数关系来表示

例如

圆的面积与半径之间的关系

电路中电阻值、电压与电流之间的关系

等等

此图为价格不变时

某商品的销售收入与销售量的关系

属于确定性关系

非确定性关系是指变量之间有一定的依赖关系

变量之间虽然相互影响和相互制约

但由于受到无法预计和控制的因素的影响

使得变量间的关系呈现不确定性

当一些变量的值确定以后

另一些变量值虽然随之变化

却不能完全确定

这时变量间的关系

就不可以精确地用函数来表示

即不能由一个或若干变量的值

精确地确定另一变量的值

例如

子女的身高与父亲

及母亲的身高之间有一定的关系

但这种关系不是确定的

即不能根据父亲与母亲的身高

精确得出子女的身高

再如某块农田粮食的产量

与施肥量之间的关系

某件商品的销售量

与广告费之间的关系等等

回归分析的主要步骤如下

(1)确定变量

明确预测的具体目标

也就是确定因变量

例如预测的具体目标是下一年度的销售量

那么销售量就是因变量

通过市场调查和查阅资料

寻找与预测目标的相关影响因素

即自变量

并从中选出主要的影响因素

(2)建立预测模型

依据自变量和因变量的

历史统计资料进行计算

在此基础上建立回归分析方程

即回归分析预测模型

(3)进行相关分析

回归分析是对具有

因果关系的影响因素(自变量)

和预测对象(因变量)

所进行的数理统计分析处理

只有当自变量与因变量

确实存在某种关系时

建立的回归方程才有意义

因此

作为自变量的因素

与作为因变量的预测对象是否有关

相关程度如何

以及判断这种相关程度的把握性多大

就成为进行回归分析必须要解决的问题

进行相关分析

一般要求出相关关系

以相关系数的大小来判断

自变量和因变量的相关的程度

(4)计算预测误差

回归预测模型是否可用于实际预测

取决于对回归预测模型的检验

和对预测误差的计算

回归方程只有通过各种检验

且预测误差较小

才能将回归方程作为预测模型进行预测

(5)确定预测值

利用回归预测模型计算预测值

并对预测值进行综合分析

确定最后的预测值

注意

应用回归预测法时

应首先确定变量之间是否存在相关关系

如果变量之间不存在相关关系

对这些变量应用回归预测法

就会得出错误的结果

数据挖掘课程列表:

第1章 概述

-1.1 数据分析与数据挖掘

--1.1 数据分析与数据挖掘

--1.1 数据分析与数据挖掘

-1.2 分析与挖掘的数据类型

--1.2 分析与挖掘的数据类型

-- 1.2 分析与挖掘的数据类型

-1.3 数据分析与数据挖掘的方法

--1.3 数据分析与数据挖掘的方法

-- 1.3 数据分析与数据挖掘的方法

-1.4 数据分析与数据挖掘使用的技术

--1.4 数据分析与数据挖掘使用的技术

--1.4 数据分析与数据挖掘使用的技术

-1.5 应用场景及存在的问题

--1.5 应用场景及存在的问题

-- 1.5 应用场景及存在的问题

-第1章 作业1

-第1章 作业2

-关于数据分析和数据挖掘的讨论

-关于数据分析与数据挖掘的讨论(研究生班级)

第2章 数据

-2.1 数据的属性

--2.1 数据的属性

-- 2.1 数据的属性

-2.2 数据的基本统计描述

--2.2.1 中心趋势度量

--2.2.2 数据分散度量

--2.2.3 数据的图形显示

--2.2 数据的基本统计描述

-2.3 数据的相似性和相异性

--2.3 数据的相似性和相异性

-- 2.3 数据的相似性和相异性

-第2章 作业1

-第2章 作业2

-关于属性类型的讨论

-关于数据属性的讨论(研究生班级)

第3章 数据预处理

-3.1 数据存在的问题

--3.1 数据存在的问题

--数据存在的问题

-3.2 数据清理

--3.2 数据清理

--数据清理

-3.3 数据集成

--3.3 数据集成

--数据集成

-3.4 数据归约

--3.4 数据规约

--数据归约

-3.5 数据变换与数据离散化

--3.5 数据变换与数据离散化

--数据变换与数据离散化

-第3章 作业1

-第3章 作业2

-关于建立数据集的讨论(研究生班级)

-关于数据预处理的讨论(研究生班级)

-关于建立数据集的讨论(本科生班级)

-关于数据预处理的讨论(本科生班级)

第4章 数据仓库和OLAP

-4.1 数据仓库基本概念

--4.1 数据仓库基本概念

--数据仓库基本概念

-4.2 数据仓库设计

--4.2 数据仓库设计

--数据仓库设计

-4.3 数据仓库实现

--4.3 数据仓库实现

--数据仓库实现

-4.4 联机分析处理

--4.4 联机分析处理

--联机分析处理

-4.5 元数据模型

--4.5 元数据模型

--元数据模型

-第4章 作业1

-第4章 作业2

-关于数据仓库和数据预处理的讨论(本科生班级)

-关于数据仓库价值的讨论(本科生班级)

-关于数据库与数据仓库的讨论(研究生班级)

第5章 回归分析

-5.1 回归分析的基本概念

--5.1 回归分析的基本概念

--回归分析的基本概念

-5.2 一元线性回归

--5.2 一元线性回归

--一元线性回归

-5.3 多元线性回归

--5.3 多元线性回归

--多元线性回归

-5.4 多项式回归

--5.4 多项式回归

--多项式回归

-第5章 作业1

-第5章 作业2

-关于回归预测法的讨论(本科生班级)

-关于回归分析的讨论(研究生班级)

-回归分析的优缺点(研究生班级)

第6章 频繁模式

-6.1 概述

--6.1 频繁模式概述

--频繁模式概述

-6.2 Apriori算法

--6.2 Apriori算法

--Apriori算法

-6.3 FP-growth算法

--6.3 FP-growth算法

--FP-growth算法

-6.4 压缩频繁项集

--6.4 压缩频繁项集

--压缩频繁项集

-6.5 关联模式评估

--6.5 关联模式评估

--关联模式评估

-第6章 作业1

-第6章 作业2

-关于Apriori算法的讨论(本科生班级)

-关于Apriori算法的讨论(研究生班级)

第7章 分类

-7.1 分类概述

--7.1 分类概述

--分类概述

-7.2 决策树

--7.2 决策树(上)

--7.2 决策树(中)

--7.2 决策树(下)

--决策树

-7.3 朴素贝叶斯分类

--7.3 朴素贝叶斯分类

--朴素贝叶斯分类

-7.4 惰性学习法

--7.4 惰性学习法

--7.4 惰性学习法

-7.5 神经网络

--7.5 神经网络(上)

--7.5 神经网络(下)

--神经网络

-7.6 分类模型的评估

--7.6 分类模型的评估(上)

--7.6 分类模型的评估(下)

--分类模型的评估

-第7章 第一部分作业2(研究生班级)

-第7章 第二部分作业2

-第7章 第二部分作业1

-关于分类算法的讨论(本科生班级)

-关于分类算法的讨论(研究生班级)

-关于神经网络的讨论(研究生班级)

第8章 聚类

-8.1 聚类概述

--8.1 聚类概述

--聚类概述

-8.2 基于划分的聚类

--8.2 基于划分的聚类(一)

--8.2 基于划分的聚类(二)

--基于划分的聚类

-8.3 基于层次的聚类

--8.3 基于层次的聚类

--基于层次的聚类

-8.4 基于密度的聚类

--8.4 基于密度的聚类

--基于密度的聚类

-8.5 基于网格的聚类

--8.5 基于网格的聚类

--基于网格的聚类

-第8章 作业1

-第8章 作业2

-关于基于划分和基于层次的聚类的讨论(本科生班级)

-关于聚类的讨论(本科生班级)

-关于聚类算法的讨论(研究生班级)

-关于聚类与数据挖掘的讨论(研究生班级)

第9章 离群点检测

-9.1 离群点定义与类型

--9.1 离群点定义与类型

--9.1 离群点定义与类型

-9.2 离群点检测

--9.2 离群点检测(一)

--9.2 离群点检测(二)

--离群点检测

-第9章 作业1

-第9章 作业2

-关于离群点检测的讨论(研究生班级)

5.1 回归分析的基本概念笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。