当前课程知识点:智能时代下的创新创业实践 > 第三章智能时代的创新技术 > 3.4智能技术带来的认知升级 > 3.42
数据思维还有一个特点就是
改变了对事件的相关关系的看法
把以前事件之间的因果关系
变成了相关关系
那么什么是两个事件的相关性呢
我用拼图的游戏来解释一下
大家都玩过拼图游戏
要把零碎的图片拼出一张完整的图
必须找到这些图片之间的联系
这些联系是细微的
不易察觉的
所以当我5岁的儿子玩复杂的拼图的时候
他几乎是拼不出来的
但有一次我发现他拼得非常快
甚至比我还快
这是为什么呢
他真的有这么聪明吗
当我把拼图翻过来才发现了奥秘所在
这个拼图的每张碎片
背后都有阿拉伯数字
只要按照背面的数字的顺序
把图片放在一起
再翻过来就是拼好的整张图
在这个例子里
正面图片之间的关系就是事件的因果关系
要找到图片之间的关系是非常难的
但是背后的数字关系却简单得多
这就是图片之间的相关关系
找到他们
就找到了解决问题的有效办法
中国有句古话
叫知其然要知其所以然
正面图片之间的关系就是
知其所以然
这需要拼图的人有复杂的逻辑分析能力
我的儿子是根本
不知其所以然
他应运的只是背后的数字
通过这些简单的数字
他跳过了前面需要复杂逻辑
才能完成的任务
按照简单的逻辑
自然得到了结果
这就是数据之间的相关性
也就是说
数据思维的本质就是
知其然但不一定要知其所以然
美国的总统竞选预测
在以前是通过民意调查问卷来做的
但是
要从几千万份
调查问卷来推测出某一年
哪一个党派的竞选人能够当选总统
并不是那么容易
而且也不准确
当人们开始了解数据相关性的分析方法后
就开始利用已有的数据
建立简单的数学模型来做竞选的预测
比如说
通过机器学习的方法来做总统竞选预测
预测是哪个党派的候选人能当选
思路是找一些与某个党派
是否竞选成功相关的参数变量
其中的一个预测算法
挑选了这样几个与候选人有关的参变量
比如候选人的三次辩论表现
候选人的政治立场
候选人的人品
那么还有一些经济数据
比如当时的失业率
工资增长率
通货膨胀率等等
把这些参变量与这个党派的候选人
是否当选建立一个线性分类模型
当然
也可以建立一个神经网络模型做一个分类器
然后用以往当选前
的历史数据来训练这个数学模型
得到理想的预测模型
这样
就可以用这个模型来预测当年
某政党是否在选举中获胜了
这个过程的细节我们在
我们在机器是如何学习的
的那一讲已经详细讨论过了
这种方法呢
比通过民意调查来预测的准确率高得多
用这个数学模型
在往年的25次
预测当中有22次都取得了成功
这种方法其实忽略掉了那些大家
看不清楚的因果关系
直接通过相关关系找到了答案
这是典型的数据思维的案例
说到这里
故事还没有结束
因为去年
用机器学习的方法做出的预测失败了
用机器学习的方法
做出的预测是希拉里获胜
但结果却是特朗普当选了
不过远在义乌为美国选民们生产
候选人支持标语的一位中国商人
却很早就知道特朗普会获胜
因为在他的订单里
有80%的订单是支持特朗普的标语
他告诉别人
特朗普的支持率蛮高的
10个人里有8个人都在支持他
他没有理由不当选
他不知道机器学习的方法
也不知道美国的选举情况
但是只从对候选人支持标语的订单数量
就得到了这样一个竞选的结果
这是因为他
找到了更简单和更准确的相关关系
这是知其然
但不一定要知其所以然的经典案例
看来
以后美国的竞选预测机构都可以关门了
大家直接请教这位商人就知道是谁当选了
这就是利用智能技术来解决问题的重要思路
在智能技术普及应用以前
要解决一个问题
一定要搞清楚两个要素之间的因果关系
也就是搞清楚是因为什么样的原因
所以才导致这样的结果
但从数据思维的角度出发
只要找到两个事件之间的数据相关性
就可以解决问题了
当然
有一大堆数据是不一定解决问题的
关键是能找到数据之间的相关关系
在商业上尤其如此
一位大数据专家曾经说过
大数据的意义
在于真正对生意有内在的洞见
如果你不能好好的利用数据
那不叫大数据
阿里曾经推出了一种保险
叫碎屏险
就是在用户购买手机的时候
推荐用户给手机购买屏幕1-3年的保险
但是这种碎屏险
并不是所有人都想购买的
那么什么样的人愿意购买这种保险呢
阿里专门为此建立了一个大数据团队
他们建了个模型
来找到碎屏险和购买者之前的关系
最后通过分析
他们意外的发现
喜欢紧身牛仔裤的人
购买这种保险的概率非常高
这样
当有人在淘宝上购买手机的同时
如果也购买了紧身牛仔裤
他们就会向这位顾客推荐碎屏险
这大大增加了碎屏险的销售
我们在创新思维方法那一讲曾经谈过
用新的角度去看待旧的事物
可以得到一些新的解决问题的方法
从数据思维的角度来看待原来的关系
就可能得到新的解决方案
数据思维在本质上是一种创新思维
我们再看一个相关性的例子
我们知道
自古以来人们就试图通过人的面部特征
来找到人的某种命运
比如中国古代有颅面术
可以通过看面相
来判断一个人以后
是否能够大富大贵或者有牢狱之灾
当然
种方法方法多少带有迷信的色彩
有意思的是
这种所谓的颅面术
通过机器学习的方法
在21世纪的今天复活了
在2016年
上海交大用AI技术做了
《基于面部图像的自动犯罪概率推断》
试图发现面相与犯罪率之间的关系
这引起了极大的争议
2017年
斯坦福大学公布了一篇论文
试图通过脸部特征来分析一个人的性取向
我们这里不讨论这些论文的道德伦理问题
我们仅仅从
数据思维的角度来看一看
这些科学家是怎么看待这个问题的
斯坦福的科学家们认为
人的面部特征
包含了很多跟性取向有关的信息
而且这些面部信息
如果单凭人的大脑分析是很难有什么结论的
他们认为一个人是否有同性恋倾向
与特别的面部特征是有关联的
这个判断是基于性取向产前激素理论
比如鼻子的形状
面部饰品的风格
和面部红外热分布图等等
他们用深度学习的方法
来对这些特征抽象并且建模
然后建立神经网络
这个神经网络的输入是人的面部特征
输出就是可能为同性恋的概率
他们把带有同性恋面部
特征的三万个数据样本
作为学习样本
通过我们上一讲
讲过的机器学习方法进行数据训练
用监督学习的方式
得到了判断一个人
是否有同性恋倾向的数学模型
通过这些案例
我们看到可以通过
数据思维找到
看似不相干事物之间的联系
这种以数据为核心的思维方式
让我们对事物之间的关系有了新的认识
-0.1我们为什么设计这门课
--0.1
-0.2我们聊什么
--0.2
-0.3你们能学到什么
--0.3
-短片:AlphaGo
--Alphago
-1.1本章概述
--1.1
-1.2人与机器的本质区别
--1.21
--1.22
--1.23
-1.3我们会被智能机器抢了饭碗吗
--1.31
--1.32
--1.33
-1.4人和智能机器的和谐之道-增强智能
--1.41
--1.42
--1.43
--1.44
--1.45
--1.46
--1.47
-1.5项目指南一:如何找到好的项目
--1.51
--1.52
--1.53
--1.54
--1.55
-第一章测试
-2.1本章概述
--2.1
-2.2创业能力模型
--2.21
--2.22
--2.23
--2.34
--2.25
--2.26
--2.27
--2.28
--2.29
-2.3创新是人类的本能
--2.31
--2.32
--2.33
-2.4创新能力培养——创新心智模式
--2.41
--2.42
--2.43
--2.44
--2.45
--2.46
-2.5创新能力要素培养-思维方式
--2.51
--2.52
--2.53
--2.54
--2.55
-2.6项目指南二:创新项目的开发
--2.61
--2.62
--2.63
-2.7互联网心理学
--2.7
-第二章测试
-3.1本章概述
--3.1
-3.2机器有“智慧”吗?
--3.21
--3.22
--3.23
--3.24
--3.25
--3.26
--3.27
-3.3机器是如何学习的?
--3.31
--3.32
--3.33
--3.34
--3.35
--3.36
--3.37
--3.38
--3.39
--3.310
-3.4智能技术带来的认知升级
--3.41
--3.42
--3.43
--3.44
--3.45
-3.5项目指南三:投资者和创始人的心得经验
--3.51
--3.52
--3.53
--3.54
--3.55
-第三章测试