当前课程知识点:商业数据思维与实战 > 第二章 数据思维 > 2.1 数据与数据思维 > 2.1.2 什么是数据思维
好 上一讲
我们了解了什么是数据
和数据的相关概念
这一讲我们来一起学习
什么是数据思维
思维是人脑对客观事物的一种反映
它反映了客观事物的本质和规律
是大脑的一种认知活动
而数据思维则是依据数据来认知
和反映事物客观规律的
一种思维模式
是应用数据来观察事物
思考并分析解决问题的
一种量化思维模式
企业在经营管理的过程中
通过数据思维
把业务问题转化为数据问题
通过数据分析去发现问题
分析和解决问题 预测问题
从而找到问题的根源
通过数据驱动业务
进行系统有效的数据管理
用数据来辅助管理决策
那数据思维是如何提出的
2007年图灵奖的得主吉姆・格雷
提出科学研究的四大范式
他从人类认知世界和改造世界的
思维方式出发
把科学思维分为四种
第一种 实验思维
也称为实证思维
是通过观察和实验
来获取自然规律法则的
一种思维方法
他以观察和归纳总结自然规律
为特征
以物理 化学等学科为代表
理论思维又称逻辑思维
它是指
通过抽象概括建立描述事物本质的
概念模型
运用科学的方法
探寻概念之间联系的一种思维方法
以社会科学学科为代表
计算思维 又称构造思维
它是指从具体的算法设计规范入手
通过算法构造和模拟仿真
来解决问题的一种思维方法
以计算机学科为代表
而数据思维
是人类科学研究的第四范式
它是数据密集型
发现范式的一种思维方法
以数据科学为代表
大数据为科学研究
提供了新的思维视角和对象
因此 数据科学应运而生
数据科学
是以数据为中心的科学
它是一门基于计算机科学
统计学 信息科学等学科的
理论和方法
对数据从产生到搜集 到分析处理
到加工利用的整个生命周期的
本质规律
进行探索和认识的交叉性新兴学科
简单来说
就是将现实世界映射到数据世界
在数据层面上去分析和研究
现实世界的问题
并根据数据分析的结果
对现实世界进行观察 解释 预测
或者决策
数据科学以数据 尤其是大数据
为研究对象
以数理统计 机器学习
数据可视化等理论和方法为基础
主要研究数据的搜集 处理 分析
计算以及数据管理等问题
最终 是为了实现从数据到信息
从数据到知识
和从数据到智慧的转化
以数据驱动业务
数据决策支持 数据洞察预测
数据产品研发
和数据生态系统构建等为主要目的
在大数据时代
企业面临着新的挑战和新的机会
也需要新的思维和新的方法
数据科学就是包括新的理论 方法
模型 技术 平台 工具
应用与实践在内的
系统的学科知识体系
数据思维又有哪些特点
第一个特点是量化性
道格拉斯在数据化决策中提到
不论是有形之物还是无形之物
一切皆可量化
量化也就是数据化
一切皆数据
量化一切是数据思维的核心
在互联网时代凡走过必留下痕迹
我们上网浏览新闻 在线购买商品
出门滴滴打车
社交数据 交易数据 出行数据
任何行为都可以被记录并量化
而量化思维是数字经济时代
数字化的必然结果
量化也是数据思维具体化的
一种表现
是数据分析的基础和前提
第二个特点 整体性
在小数据时代
不可能获取和搜集
全部数据的情况下
我们通过随机采样
用样本数据去推断总体的特征
而大数据时代
我们采用全数据的模式
即 样本即总体
用整体反映全貌
数据思维的主要特点之一
就是整体性
事物的本质和规律
隐藏在各种原始数据的
相互关联之中
整体才能反映事物的本质特征
因为每种数据来源
都有一定的局限性和片面性
只有融合集成各方面的数据
才能反映事物的全貌
以整体性的思维把握事物本身
才能真正客观全面的把握事物本质
及其发展变化的规律和趋势
第三个特点 关联性
关联性是数据思维的重要特征
通过数据关联能够发现
隐藏在数据背后的问题
甚至预测未来
著名的“啤酒与尿布”就是一个
体现数据关联性的经典案例
在20世纪90年代
美国的沃尔玛超市
拥有全世界最大的数据仓库系统
为了能够准确地了解顾客
在其门店的购买习惯
沃尔玛对顾客的购物行为
进行了数据分析
想知道顾客经常一起购买的商品
有哪些
利用数据分析的方法
对这些原始的交易数据
进行分析与挖掘
竟然意外的发现跟尿布一起购买
最多的商品竟然是啤酒
经过大量的调查
他们揭示了一个
隐藏在啤酒与尿布背后的
一种人的行为模式
在美国
一些年轻的父亲下班后
经常要到超市去购买婴儿尿布
而他们当中有30%-40%的人
同时也会顺手为自己购买一些啤酒
这两类商品看似无关
但通过数据的关联分析
我们找到了其中隐含的销售规律
无独有偶
在2008年 谷歌公司
通过对数十亿网络搜索请求的
数据整合与分析
对世界各地区的流感作出预测
将数据思维运用于预测某地
流感暴发的趋势
通过挖掘搜索数据的关联价值
也获得了巨大的成功和关注
事物是广泛联系的
数据是动态多维的
只有对各个领域的数据进行集成
通过数据的重组 扩展和再利用
实现数据共享 打通信息孤岛
才能发掘数据背后蕴含的信息
创造更多的实际应用价值
《大数据时代》的作者
维克托提出过三个观点
第一 需要全部的数据
而不是样本抽样
第二 关注效率而不是精确度
第三 关注相关性而不是因果关系
这些观点从某种程度上
也反映了数据思维的一些特点
好 本讲的学习我们先到这儿
-1.1 数字和数字的产生
--测验1
-1.2 信息、信息技术和信息经济
--测验2
-1.3 数字经济及其特征、发展趋势
--测验3
-1.4 数据伦理
--测验4
-单元测验
-2.1 数据与数据思维
--2.1测验
-2.2 大数据时代的数据思维
--2.2测验
-单元测验
-3.1 大数据时代的商业模式变革
--3.1 测试
-3.2商业数据思维案例分析
-单元测试
-4.1 大数据时代下的统计分析
--4.1 测试
-4.2 数据分析基础
-4.3 统计分析方法专题Ⅰ
--4.3 测试
-单元测试
-5.1 统计分析方法专题Ⅱ
--5.1 测试
-5.2 文本分析
--评论语料
--5.2 测试
-结合从网络中已爬取的商业数据,讨论如何对其中的文本数据进行分析?
-单元测试
-6.1 商业选题
--6.1 测试
-6.2 数据提取
--6.2 测试
-单元测试
-7.1 数据预处理
--7.1 测试
-7.2 数据分析与挖掘
--7.2 测试
-基于对研究数据的预处理结果,讨论如何对其进行进一步的分析与挖掘?
-单元测试
-8.1 数据可视化
--8.1 测试
-8.2 报告撰写
--8.2 测试
-基于对数据不同阶段的处理结果,讨论如何对其进行可视化展示?
-单元测试
-期末考试