当前课程知识点:大数据管理与挖掘 > 第8章 分类方法 > 8.5 LOGISTIC分类 > 8.5 LOGISTIC分类
大家好
我是西安工程大学
管理学院的邵景峰教授
欢迎回来
本节呢
我们主要讲Logistic分类
什么是Logistic分类呢
具体的线性回归模型
我们可以从如下所示的图呢
可以展示出来
在这个图里面
我们可以进行Logit它的变换过程
具体过程从如下图所示
式中p表示事件发生的概率
1-p表示事件不发生的概率
在这里面
当p=1的时候
logit(p)=+∞,
当p=0.5的时候
logit(p)=0
当p=0的时候
logit(p)=-∞
由此呢在这个过程当中
logit(p)的取值范围
我们可以确定为(-∞+∞)
而且在这个式子当中
等号右边的分数 [p/(1-p)]
是我们最常见的
流行病学最常用的
用来描述疾病发生的强度的一些统计指标
在这里面我们通常称为优势
当疾病发生的概率p
与不发生的概率q之间
相互之间接近为0.5的时候
odds=1
否则我们这个odds大于或小于1
具体的Logistic模型呢
我们可以从如下所示的图呢
展示出来
在这里面
Βi表示自变量xi到改变一个单位的时候
logit(p)的它的改变量
其具体形式如下图所示
我们可以从上面图呢
可以总结出
Logistic的特点
第一个呢就是预测值域在0-1之间
符合二分类问题
还可以作为某种特殊情况发生的概率
比方说
我们可以预测股票的涨跌概率
信用评价概率
还有好坏人的概率等等
第二呢就是
模型的值呈S状形状
在这里面
当某种特殊问题进行预测的时候
比方说我们可以采取
流行病学对危险因素
与疾病风险关系的预测的时候
我们可以采取这种方式
第三个呢
它的不足之处在于
对数据和场景的适应能力呢有限
它不如神经网络和决策树那样的
同样算法的适应性
这种比较强的这种模型
这节课的内容
我主要介绍到这里
-第1章 教学目标
--第1章 教学目标
-1.1 大数据的基本概念
-1.2 大数据的演变过程
-1.3 大数据应用
-1.4 大数据的处理模式
-1.5 大数据管理的关键技术
-第1章 作业
--第1章 作业
-第1章 讨论
--第1章 讨论
-第2章 教学目标
--第2章 教学目标
-2.1 大数据融合的概念
-2.2 大数据融合的方法论
-2.3 数据融合技术
-2.4 知识融合技术
-2.5 大数据融合的驱动枢纽
-2.6 小结
--2.6 小结
-第2章 作业
--第2章 作业
-第2章 讨论
--第2章 讨论
-第3章 教学目标
--第3章 教学目标
-3.1 大数据存储与管理方法
-3.2 基于新型存储的大数据管理
-3.3 大数据处理与存储一体化技术
-3.4 小结
--3.4 小结
-第3章 作业
--第3章 作业
-第3章 讨论
--第3章 讨论
-第4章 教学目标
--第4章 教学目标
-4.1 大数据的实时分析
-4.2 大数据的交互式分析
-4.3 云在线聚集
-4.4 大数据的智能分析
-4.5 小结
--4.5 小结
-第4章 作业
--第4章 作业
-第4章 讨论
--第4章 讨论
-第5章 教学目标
--第5章 教学目标
-5.1 隐私保护技术
-5.2 隐私保护技术的应用
-5.3 大数据隐私管理
-5.4 小结
--5.4 小结
-第5章 作业
--第5章 作业
-第5章 讨论
--第5章 讨论
-第6章 教学目标
--第6章 教学目标
-6.1 云计算 大数据基础平台与支撑技术
-6.2 批数据与流数据管理系统
-6.3 SQL NOSQL与NEWSQL系统
-6.4 小结
--6.4 小结
-第6章 作业
--第6章 作业
-第6章 讨论
--第6章 讨论
-第7章 教学目标
--第7章 教学目标
-7.1 一元回归
--7.1 一元回归
-7.2 多元回归
--7.2 多元回归
-7.3 逐步回归
--7.3 逐步回归
-7.4 Logistic回归
-7.5 应用实例-多因子选股模型的实现
-7.6 小结
--7.6 小结
-第7章 作业
--第7章 作业
-第7章 讨论
--第7章 讨论
-第8章 教学目标
--第8章 教学目标
-8.1 分类方法概要
-8.2 K-近邻(KNN)
-8.3 贝叶斯分类
-8.4 神经网络
--8.4 神经网络
-8.5 LOGISTIC分类
-8.6 判别分析
--8.6 判别分析
-8.7 支持向量机(SVM)
-8.8 决策树
--8.8 决策树
-8.9 分类的评判
-8.10 小结
--8.10 小结
-第8章 作业
--第8章 作业
-第8章 讨论
--第8章 讨论
-第9章 教学目标
--第9章 教学目标
-9.1 聚类方法概要
-9.2 K-means方法
-9.3 层次聚类
--9.3 层次聚类
-9.4 神经网络聚类
-9.5 模糊C-均值(FCM)方法
-9.6 高斯混合聚类方法
-9.7 类别数的确定方法
-9.8 应用实例-股票聚类分池
-9.9 小结
--9.9 小结
-第9章 作业
--第9章 作业
-第9章 讨论
--第9章 讨论
-第10章 教学目标
-10.1 预测方法概要
-10.2 灰色预测
-10.3 马尔科夫预测
-10.4 实用实例-纺纱质量预测
-10.5 小结
--10.5 小结
-第10章 作业
--第10章 作业
-第10章 讨论
--第10章 讨论
-第11章 教学目标
-11.1 离群点诊断概要
-11.2 基于统计的离群点诊断
-11.3 基于距离的离群点诊断
-11.4 基于密度的离群点挖掘
-11.5 基于聚类的离群点挖掘
-11.6 应用实例-纱线断点诊断
-11.7 小结
--11.7 小结
-第11章 作业
--第11章 作业
-第12章 教学目标
-12.1 数字挖掘技术的应用
-12.2 纺纱质量控制
-第12章 作业
--第12章 作业
-第12章 讨论
--第12章 讨论