当前课程知识点：大数据管理与挖掘 > 第7章数据回归方法 > 7.5 应用实例-多因子选股模型的实现 > 7.5 应用实例-多因子选股模型的实现

返回《大数据管理与挖掘》慕课在线视频课程列表

7.5 应用实例-多因子选股模型的实现在线视频

下一节:7.6 小结

返回《大数据管理与挖掘》慕课在线视频列表

7.5 应用实例-多因子选股模型的实现课程教案、知识点、字幕

欢迎回来

我们这节课呢讲我们7.5内容

就是我们选择了一个例子

作为一个来解释我们的多元回归方程

在这里面

我们主要以多因子选股模型的

它的实现过程来进行解释

在这里面

我们的多因子模型它基本思想

我们可以看一下

在这里面

它所采用最广泛的一种选股模型

它基本原理就是

采用一系列的因子作为选股标准

以满足这些因子的基本模型

或者说股票则作为买方

在不满足的情况下我们可以则卖出去

我们呢举一个最简单的例子

如果有一批人参加马拉松

想要知道哪些人会跑到平均成绩以上

只需在跑前做一个身体测试为止

我们通过这个测试呢

那些健康指标靠前的运动员

获得超越平均成绩的可能性较大

多因子模型的原理与此类似

只要找到那些对企业的

收益率最相关的因子即可

在我们整个过程当中

一种多因a模型核心的区别在于

第一个就是在因子的选取上

第二个就是在如何采用多因子

综合得到一个最终的判断

一般情况下

多因子选股模型有两种判断方法

一是打分法

二是我们的回归法

而具体来讲打分法就是根据

各个因子的大小对选股票进行打分

然后按照一定的权重加权得到一个分值

根据总分再将我们的股票进行筛选

而我们的回归分析方法呢

主要是通过对选票的收益率

进行多因子进行回归

它得到一个回归方程

然后把最新的因子值代入回归方程

得到一个对股票收益率的预判

再以此为依据进行选股

由此呢

在我们整个多因子选股模型的

构建过程呢可以从以下可以看出来

一个就是我们的

候选因子的选取

第二个就是选股因子有效性的检验

在有效检验的基础上

进行有效但冗余因子的剔除

第四个就是综合评分模型的建立

第五个就是模型的评价与持续

具体过程如下所示

在我们的多因子模型的实现过程当中

首先我们导入如下所示的各种数据

在这个数据的基础上

进行我们的多元线性回归

在多元线性回归的基础上

对我们整个程序呢进行执行

执行的时候呢

我们可以得到我们具体的模型

以及模型所示的一些参数

如下面所示

在这个基础上

对模型中的原始数据进行预测

从而得到我们的股票综合得分

如我们下图所示

在这个图上面我们可以看出

尽管这些数据存在一定的偏差

但三个簇的分层还是比较明显的

这个明显呢主要说明我们模型

在整个刻画数据的有效性方面

还是有较高的准确度的

在这基础上

对所有的变量进行回归

我们进行所谓的逐步回归

也可以使用这个过程

对我们的因子呢进行筛选

由此可以得到我们的优选因子对应的模型

具体的实现过程如下面所示

在这个执行完以后

我们可以得到与我们模型对应的

相关参数

具体参数呢我们可以从下面可以得到

由此呢

在整个模型中

我们可以看出

逐步回归模型

可以得到模型中5个单因子

多了5个组合因子

而模型的决定参数呢反而提高了一些

这充分说明我们的逐步回归

在得到的模型基础上

我们精度呢会更加的高一点

而我们的影响因子会更加少一点

对于我们的分析模型而言

本身是非常有帮助的

尤其是在剔除因子方面

接着呢

在这基础上

我们通过我们的逐步回归模型

可以得到我们的综合得分

与我们的原始得分的比较结果呢如下图所示

我们可以看一下

在这基础上

我们可以建立在我们市场无效

或者说弱有效的前提下

对我们的多因子选股模型

进行不断的迭代

或者说对我们的投资者的数量的不断增加

当有的增加过程会逐渐失效

而在这一过程当中

我们可以用一些新的因素

对我们的模型进行检验

反而这些检验增加了我们模型的有效性

在这基础上

一些因子

可能在过去的市场环境下可能是有效的

但是随着我们市场风格的变动

这些因子可能会短时间内会失效

在这种情况下我们可对以前无效的因子

根据我们当前市场变化呢

进行替换

或者说对它们市场环境呢

表现情况呢进行更新

多因子的选股模型我就给大家介绍到这

下面呢

我对我们第七章的内容呢做一个小结

大数据管理与挖掘课程列表：

第1章课程概述

-第1章教学目标

--第1章教学目标

-1.1 大数据的基本概念

--1.1 大数据的基本概念

-1.2 大数据的演变过程

--1.2 大数据的演变过程

-1.3 大数据应用

--1.3 大数据应用

-1.4 大数据的处理模式

--1.4 大数据的处理模式

-1.5 大数据管理的关键技术

--1.5 大数据管理的关键技术

-第1章作业

--第1章作业

-第1章讨论

--第1章讨论

第2章大数据融合

-第2章教学目标

--第2章教学目标

-2.1 大数据融合的概念

--2.1 大数据融合的概念

-2.2 大数据融合的方法论

--2.2 大数据融合的方法论

-2.3 数据融合技术

--2.3 数据融合技术

-2.4 知识融合技术

--2.4 知识融合技术

-2.5 大数据融合的驱动枢纽

--2.5 大数据融合的驱动枢纽

-2.6 小结

-第2章作业

--第2章作业

-第2章讨论

--第2章讨论

第3章大数据存储

-第3章教学目标

--第3章教学目标

-3.1 大数据存储与管理方法

--3.1 大数据存储与管理方法

-3.2 基于新型存储的大数据管理

--3.2 基于新型存储的大数据管理

-3.3 大数据处理与存储一体化技术

--3.3 大数据处理与存储一体化技术

-3.4 小结

-第3章作业

--第3章作业

-第3章讨论

--第3章讨论

第4章大数据分析

-第4章教学目标

--第4章教学目标

-4.1 大数据的实时分析

--4.1 大数据的实时分析

-4.2 大数据的交互式分析

--4.2 大数据的交互式分析

-4.3 云在线聚集

--4.3 云在线聚集

-4.4 大数据的智能分析

--4.4 大数据的智能分析

-4.5 小结

-第4章作业

--第4章作业

-第4章讨论

--第4章讨论

第5章大数据隐私

-第5章教学目标

--第5章教学目标

-5.1 隐私保护技术

--5.1 隐私保护技术

-5.2 隐私保护技术的应用

--5.2 隐私保护技术的应用

-5.3 大数据隐私管理

--5.3 大数据隐私管理

-5.4 小结

-第5章作业

--第5章作业

-第5章讨论

--第5章讨论

第6章大数据管理系统

-第6章教学目标

--第6章教学目标

-6.1 云计算大数据基础平台与支撑技术

--6.1 云计算大数据基础平台与支撑技术

-6.2 批数据与流数据管理系统

--6.2 批数据与流数据管理系统

-6.3 SQL NOSQL与NEWSQL系统

--6.3 SQL NOSQL与NEWSQL系统

-6.4 小结

-第6章作业

--第6章作业

-第6章讨论

--第6章讨论

第7章数据回归方法

-第7章教学目标

--第7章教学目标

-7.1 一元回归

--7.1 一元回归

-7.2 多元回归

--7.2 多元回归

-7.3 逐步回归

--7.3 逐步回归

-7.4 Logistic回归

--7.4 Logistic回归

-7.5 应用实例-多因子选股模型的实现

--7.5 应用实例-多因子选股模型的实现

-7.6 小结

-第7章作业

--第7章作业

-第7章讨论

--第7章讨论

第8章分类方法

-第8章教学目标

--第8章教学目标

-8.1 分类方法概要

--8.1 分类方法概要

-8.2 K-近邻（KNN）

--8.2 K-近邻（KNN）

-8.3 贝叶斯分类

--8.3 贝叶斯分类

-8.4 神经网络

--8.4 神经网络

-8.5 LOGISTIC分类

--8.5 LOGISTIC分类

-8.6 判别分析

--8.6 判别分析

-8.7 支持向量机（SVM）

--8.7 支持向量机（SVM）

-8.8 决策树

--8.8 决策树

-8.9 分类的评判

--8.9 分类的评判

-8.10 小结

-第8章作业

--第8章作业

-第8章讨论

--第8章讨论

第9章聚类方法

-第9章教学目标

--第9章教学目标

-9.1 聚类方法概要

--9.1 聚类方法概要

-9.2 K-means方法

--9.2 K-means方法

-9.3 层次聚类

--9.3 层次聚类

-9.4 神经网络聚类

--9.4 神经网络聚类

-9.5 模糊C-均值（FCM）方法

--9.5 模糊C-均值（FCM）方法

-9.6 高斯混合聚类方法

--9.6 高斯混合聚类方法

-9.7 类别数的确定方法

--9.7 类别数的确定方法

-9.8 应用实例-股票聚类分池

--9.8 应用实例-股票聚类分池

-9.9 小结

-第9章作业

--第9章作业

-第9章讨论

--第9章讨论

第10章预测方法

-第10章教学目标

--第10章教学目标

-10.1 预测方法概要

--10.1 预测方法概要

-10.2 灰色预测

--10.2 灰色预测

-10.3 马尔科夫预测

--10.3 马尔科夫预测

-10.4 实用实例-纺纱质量预测

--10.4 实用实例-纺纱质量预测

-10.5 小结

-第10章作业

--第10章作业

-第10章讨论

--第10章讨论

第11章诊断方法

-第11章教学目标

--第十一章教学目标

-11.1 离群点诊断概要

--11.1 离群点诊断概要

-11.2 基于统计的离群点诊断

--11.2 基于统计的离群点诊断

-11.3 基于距离的离群点诊断

--11.3 基于距离的离群点诊断

-11.4 基于密度的离群点挖掘

--11.4 基于密度的离群点挖掘

-11.5 基于聚类的离群点挖掘

--11.5 基于聚类的离群点挖掘

-11.6 应用实例-纱线断点诊断

--11.6 应用实例-纱线断点诊断

-11.7 小结

-第11章作业

--第11章作业

第12章大数据技术应用

-第12章教学目标

--第12章教学目标

-12.1 数字挖掘技术的应用

--12.1 数字挖掘技术的应用

-12.2 纺纱质量控制

--12.2 纺纱质量控制

-第12章作业

--第12章作业

-第12章讨论

--第12章讨论

7.5 应用实例-多因子选股模型的实现笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航课程版权归原始院校所有，
本网站仅通过互联网进行慕课课程索引，不提供在线课程学习和视频，请同学们点击报名到课程提供网站进行学习。