当前课程知识点:商业数据思维与实战 > 第二章 数据思维 > 2.2 大数据时代的数据思维 > 2.2.2 数据思维的应用流程
好 这一讲我们一起来了解
数据思维的应用流程
在实际应用中
数据思维的应用是一个综合性
系统性的过程
一般来说
我们可以把数据思维的应用流程
分为四个环节
分别是问题发现 数据分析
结果呈现和解决对策
在这里 又包含了两个循环
第一个 是将实际的业务问题
转化为数据分析问题
第二个循环 是将数据分析的结果
再还原为实际问题的解决方案
我们来看第一步
理解并发现问题
发现问题是应用数据思维的第一步
要怎样发现并理解问题
找到问题真正的原因
问题的来源通常有两种
一类是对现状的不满意
一类问题则是对未来不确定性预测
问题直接决定着数据搜集的方向
制约数据分析的过程
影响数据分析的结果
那如何从一堆数据中找到新的问题
甚至 我们需要通过问题
来满足现实的业务需求
找到未来的发展趋势
并且作出预测
发现现状 有一个万能的公式
也就是问题
等于预期和现状之间的差距
比如 我们发现
在商品广告投入和商品质量
没有变化的情况下
本月用户的平均消费额却下降了
如果广告投入和商品质量
都没有变化
正常的情况
是本月用户的平均消费额不变才对
而现状却是平均消费额减少了
我们在这里就发现了差距
也就是问题
需要用数据分析的方法
再去寻找问题背后的原因
预测型的问题
通常要寻找决定该事物的关键要素
找到问题的核心
因此
我们需要对模糊的直觉和预感
进行聚焦
将提问指向真正的痛点
比如 营销问题
核心是客户需求的满足
而如何满足客户需求
就可以用数据推演
来预测市场营销活动的结果
有了问题
我们还需要结合实际业务
对问题进行分解
进一步的理解问题
明白价值链中各项数据之间的关系
并确定要解决该问题需要哪些数据
如何获取这些数据
数据之间的关系如何等等
第二步
数据的准备与分析
不管是对现状的问题
还是对未来预测的问题
数据准备和分析的过程
是至关重要的
而其中数据准备的数据搜集和加工
是整个数据分析过程的原材料
如果没有丰富的原材料
巧妇也难为无米之炊
一个具有良好的数据思维的人
在发现和理解问题阶段
就会尽量的把数据提前收集起来
做好数据的买点和数据的校验
保证数据的精确性和完整性
比如 我们要设计一个APP
就可以提前做好数据买点
包括启动的次数 页面访问的时间
功能 点击次数等等
数据校验也非常重要
没有校验过的数据
分析价值往往不高
或者清洗起来非常复杂
数据收集完成之后就是数据的加工
大部分的数据都零散的
存放在文件或者是数据库当中
所以 进行数据加工
首先需要进行数据整合
数据加工的目的
是为了得到数据指标的结果
数据指标是业务问题的数据化表现
比如 我们上面讲到
本月消费总额和本月消费人数
越是复杂的数据问题
数据的指标就会越多 也越精细
除了常规的数据指标
在数据的加工阶段
为了使数据分析更加的方便和准确
还需要对一些连续数值的数据
进行指标的离散化
比如 我们可以按风险
把用户分为不同的风险偏好等级
定义好离散化的数据指标后
那具体哪些用户属于什么等级
就是数据分析阶段需要做的事情了
在数据分析中
根据问题的难易程度
我们可以使用系统优化
或决策支持的分析方法
系统优化是指
帮助用户构建让计算机执行的
方案或算法
常用的系统优化方法
比如像机器学习
相比简单模型的决策模型
系统通过机器学习方法
分析出更详细的因素
比如 系统优化能分析出
广告投入多少金额
能带来新用户的快速增长
以及在广告投放中
具体什么投放渠道效果会更好
机器学习的优势在于
从数据中学习出其本身包含的
模式和规律
并以此来建立模型
比如 今日头条
就是通过分析我们过去的浏览记录
利用机器学习建立模型
来给我们推荐类似的新闻内容
系统优化用到的统计方法
有逻辑回归分析 聚类分析
主成分分析 决策树分析等等
决策支持是通过相对简单的求和
和易于理解的分析模型
帮助用户做出决策
比如 对比本月同比和环比的
用户平均消费金额
从而决定通过什么决策活动来提高
用户的平均消费金额
比如建立一个广告投入因素
和新增用户的关系模型
能够预测投入多少广告额
从而带来多少的新增用户
简单的关系模型
我们可以通过向Excel Spss这些
来进行分析
比如我们经常做的柱状图 折线图
如果一项因素引发的问题很复杂
我们就需要建立一个
由多个因素组成的预测模型
通过这个模型
我们可以观察模型当中某个因素
对结果造成的影响
预测模型需要用到的统计方法
有交叉列表统计 假设检验
多元回归分析等等
可以使用R Python等
数据科学的语言工具
结果呈现是第三步
结果呈现就是我们通常所说的
数据可视化
用图表 图形 图像
来表达数据的结论
并且进一步的理解问题
如果说数据分析过程
是为了让结果尽量的全面可靠
可视化呈现的目的就是为了
让分析的结果能尽量的
被更多的人所理解
并且适用于更多的情况
这一过程的作用
是将数据分析结果呈现给最终的用户
并且接受用户的反馈
以及提出可行的方案
进而完成决策支持
第四步是解决对策
对于数据分析决策支持得到的结果
我们可以通过决策结果直接决定
或者做 或者不做某事
对于数据分析系统优化得到的结果
我们可以在计算机上
执行解决问题的决策算法
无论什么决策结果
都需要评估 执行和决策结果成本
以及决策的风险
为了评估成本和风险
在做决策的时候
我们可以通过把预估的数据
代入到决策模型当中
进行模拟仿真或计算
从而得到可能的结果
与此同时
我们可能还需要不断的和周围的人
来传达我们整个数据分析的过程
告诉他们
我们决策的数据依据来源
这样会有助于推进决策结果
好 这一讲的内容我们先到这儿
-1.1 数字和数字的产生
--测验1
-1.2 信息、信息技术和信息经济
--测验2
-1.3 数字经济及其特征、发展趋势
--测验3
-1.4 数据伦理
--测验4
-单元测验
-2.1 数据与数据思维
--2.1测验
-2.2 大数据时代的数据思维
--2.2测验
-单元测验
-3.1 大数据时代的商业模式变革
--3.1 测试
-3.2商业数据思维案例分析
-单元测试
-4.1 大数据时代下的统计分析
--4.1 测试
-4.2 数据分析基础
-4.3 统计分析方法专题Ⅰ
--4.3 测试
-单元测试
-5.1 统计分析方法专题Ⅱ
--5.1 测试
-5.2 文本分析
--评论语料
--5.2 测试
-结合从网络中已爬取的商业数据,讨论如何对其中的文本数据进行分析?
-单元测试
-6.1 商业选题
--6.1 测试
-6.2 数据提取
--6.2 测试
-单元测试
-7.1 数据预处理
--7.1 测试
-7.2 数据分析与挖掘
--7.2 测试
-基于对研究数据的预处理结果,讨论如何对其进行进一步的分析与挖掘?
-单元测试
-8.1 数据可视化
--8.1 测试
-8.2 报告撰写
--8.2 测试
-基于对数据不同阶段的处理结果,讨论如何对其进行可视化展示?
-单元测试
-期末考试