当前课程知识点:大数据管理与挖掘 > 第7章 数据回归方法 > 7.5 应用实例-多因子选股模型的实现 > 7.5 应用实例-多因子选股模型的实现
欢迎回来
我们这节课呢讲我们7.5内容
就是我们选择了一个例子
作为一个来解释我们的多元回归方程
在这里面
我们主要以多因子选股模型的
它的实现过程来进行解释
在这里面
我们的多因子模型它基本思想
我们可以看一下
在这里面
它所采用最广泛的一种选股模型
它基本原理就是
采用一系列的因子作为选股标准
以满足这些因子的基本模型
或者说股票则作为买方
在不满足的情况下我们可以则卖出去
我们呢举一个最简单的例子
如果有一批人参加马拉松
想要知道哪些人会跑到平均成绩以上
只需在跑前做一个身体测试为止
我们通过这个测试呢
那些健康指标靠前的运动员
获得超越平均成绩的可能性较大
多因子模型的原理与此类似
只要找到那些对企业的
收益率最相关的因子即可
在我们整个过程当中
一种多因a模型核心的区别在于
第一个就是在因子的选取上
第二个就是在如何采用多因子
综合得到一个最终的判断
一般情况下
多因子选股模型有两种判断方法
一是打分法
二是我们的回归法
而具体来讲打分法就是根据
各个因子的大小对选股票进行打分
然后按照一定的权重加权得到一个分值
根据总分再将我们的股票进行筛选
而我们的回归分析方法呢
主要是通过对选票的收益率
进行多因子进行回归
它得到一个回归方程
然后把最新的因子值代入回归方程
得到一个对股票收益率的预判
再以此为依据进行选股
由此呢
在我们整个多因子选股模型的
构建过程呢可以从以下可以看出来
一个就是我们的
候选因子的选取
第二个就是选股因子有效性的检验
在有效检验的基础上
进行有效但冗余因子的剔除
第四个就是综合评分模型的建立
第五个就是模型的评价与持续
具体过程如下所示
在我们的多因子模型的实现过程当中
首先我们导入如下所示的各种数据
在这个数据的基础上
进行我们的多元线性回归
在多元线性回归的基础上
对我们整个程序呢进行执行
执行的时候呢
我们可以得到我们具体的模型
以及模型所示的一些参数
如下面所示
在这个基础上
对模型中的原始数据进行预测
从而得到我们的股票综合得分
如我们下图所示
在这个图上面我们可以看出
尽管这些数据存在一定的偏差
但三个簇的分层还是比较明显的
这个明显呢主要说明我们模型
在整个刻画数据的有效性方面
还是有较高的准确度的
在这基础上
对所有的变量进行回归
我们进行所谓的逐步回归
也可以使用这个过程
对我们的因子呢进行筛选
由此可以得到我们的优选因子对应的模型
具体的实现过程如下面所示
在这个执行完以后
我们可以得到与我们模型对应的
相关参数
具体参数呢我们可以从下面可以得到
由此呢
在整个模型中
我们可以看出
逐步回归模型
可以得到模型中5个单因子
多了5个组合因子
而模型的决定参数呢反而提高了一些
这充分说明我们的逐步回归
在得到的模型基础上
我们精度呢会更加的高一点
而我们的影响因子会更加少一点
对于我们的分析模型而言
本身是非常有帮助的
尤其是在剔除因子方面
接着呢
在这基础上
我们通过我们的逐步回归模型
可以得到我们的综合得分
与我们的原始得分的比较结果呢如下图所示
我们可以看一下
在这基础上
我们可以建立在我们市场无效
或者说弱有效的前提下
对我们的多因子选股模型
进行不断的迭代
或者说对我们的投资者的数量的不断增加
当有的增加过程会逐渐失效
而在这一过程当中
我们可以用一些新的因素
对我们的模型进行检验
反而这些检验增加了我们模型的有效性
在这基础上
一些因子
可能在过去的市场环境下可能是有效的
但是随着我们市场风格的变动
这些因子可能会短时间内会失效
在这种情况下我们可对以前无效的因子
根据我们当前市场变化呢
进行替换
或者说对它们市场环境呢
表现情况呢进行更新
多因子的选股模型我就给大家介绍到这
下面呢
我对我们第七章的内容呢做一个小结
-第1章 教学目标
--第1章 教学目标
-1.1 大数据的基本概念
-1.2 大数据的演变过程
-1.3 大数据应用
-1.4 大数据的处理模式
-1.5 大数据管理的关键技术
-第1章 作业
--第1章 作业
-第1章 讨论
--第1章 讨论
-第2章 教学目标
--第2章 教学目标
-2.1 大数据融合的概念
-2.2 大数据融合的方法论
-2.3 数据融合技术
-2.4 知识融合技术
-2.5 大数据融合的驱动枢纽
-2.6 小结
--2.6 小结
-第2章 作业
--第2章 作业
-第2章 讨论
--第2章 讨论
-第3章 教学目标
--第3章 教学目标
-3.1 大数据存储与管理方法
-3.2 基于新型存储的大数据管理
-3.3 大数据处理与存储一体化技术
-3.4 小结
--3.4 小结
-第3章 作业
--第3章 作业
-第3章 讨论
--第3章 讨论
-第4章 教学目标
--第4章 教学目标
-4.1 大数据的实时分析
-4.2 大数据的交互式分析
-4.3 云在线聚集
-4.4 大数据的智能分析
-4.5 小结
--4.5 小结
-第4章 作业
--第4章 作业
-第4章 讨论
--第4章 讨论
-第5章 教学目标
--第5章 教学目标
-5.1 隐私保护技术
-5.2 隐私保护技术的应用
-5.3 大数据隐私管理
-5.4 小结
--5.4 小结
-第5章 作业
--第5章 作业
-第5章 讨论
--第5章 讨论
-第6章 教学目标
--第6章 教学目标
-6.1 云计算 大数据基础平台与支撑技术
-6.2 批数据与流数据管理系统
-6.3 SQL NOSQL与NEWSQL系统
-6.4 小结
--6.4 小结
-第6章 作业
--第6章 作业
-第6章 讨论
--第6章 讨论
-第7章 教学目标
--第7章 教学目标
-7.1 一元回归
--7.1 一元回归
-7.2 多元回归
--7.2 多元回归
-7.3 逐步回归
--7.3 逐步回归
-7.4 Logistic回归
-7.5 应用实例-多因子选股模型的实现
-7.6 小结
--7.6 小结
-第7章 作业
--第7章 作业
-第7章 讨论
--第7章 讨论
-第8章 教学目标
--第8章 教学目标
-8.1 分类方法概要
-8.2 K-近邻(KNN)
-8.3 贝叶斯分类
-8.4 神经网络
--8.4 神经网络
-8.5 LOGISTIC分类
-8.6 判别分析
--8.6 判别分析
-8.7 支持向量机(SVM)
-8.8 决策树
--8.8 决策树
-8.9 分类的评判
-8.10 小结
--8.10 小结
-第8章 作业
--第8章 作业
-第8章 讨论
--第8章 讨论
-第9章 教学目标
--第9章 教学目标
-9.1 聚类方法概要
-9.2 K-means方法
-9.3 层次聚类
--9.3 层次聚类
-9.4 神经网络聚类
-9.5 模糊C-均值(FCM)方法
-9.6 高斯混合聚类方法
-9.7 类别数的确定方法
-9.8 应用实例-股票聚类分池
-9.9 小结
--9.9 小结
-第9章 作业
--第9章 作业
-第9章 讨论
--第9章 讨论
-第10章 教学目标
-10.1 预测方法概要
-10.2 灰色预测
-10.3 马尔科夫预测
-10.4 实用实例-纺纱质量预测
-10.5 小结
--10.5 小结
-第10章 作业
--第10章 作业
-第10章 讨论
--第10章 讨论
-第11章 教学目标
-11.1 离群点诊断概要
-11.2 基于统计的离群点诊断
-11.3 基于距离的离群点诊断
-11.4 基于密度的离群点挖掘
-11.5 基于聚类的离群点挖掘
-11.6 应用实例-纱线断点诊断
-11.7 小结
--11.7 小结
-第11章 作业
--第11章 作业
-第12章 教学目标
-12.1 数字挖掘技术的应用
-12.2 纺纱质量控制
-第12章 作业
--第12章 作业
-第12章 讨论
--第12章 讨论