当前课程知识点:新城市科学 > 3. 地理数据分析、可视化与商业智能 > 3.3 如何应用地理思维 > 课程视频
那具体到怎么去应用数据的话
我们经过这几年的实践
也总结了一些套路
三个方面
那这个方面也是根据
场景的复杂的程度
然后有一个递进的关系
我们一一来看一下
简单来说就是隐性思维显性化
显性思维结构化
结构思维智能化
先看第一个 隐性思维显性化
这个怎么来理解呢
也举个例子
比如说房价的数据
我们一些用户里面
很多都会用到房价数据
比如说像房地产开发商
或者做房地产 做一些咨询
或者说一些
做一些贷款金融业务
要去评估一个项目风险的时候
都会利用到房价的数据
那往往 以往的时候
我们去看房价的数据
更多的是一张表格
告诉你哪个小区多少钱 是吧
这样其实不是很直观
所以我们把它放到地图上
一下就明晰了
至少说我们知道这些价钱
在一个城市里面是怎么分布的
这是重庆市
这是当时我们的一个
金融贷款的一个项目的数据
当然这个还不是
大家只能看到说
Ok 这些房价数据是分布在哪的
不知道哪个地方房价高 房价低
那我们再加一个维度
比如说我们就按照房价高低
然后用一些形状 用一些尺寸
用一些圆圈尺寸和颜色
把它表达出来
就一目了然了
你看这个地方
市中心的地方
肯定是房价比较高的 对吧
但是你看这个地方
这是当时我们用户
他的一个带评估项目的地点
发现这个地方房价其实也挺高的
虽然离市中心是有点距离了
所以说从这个地方
从一个表格到这样的一个
我们得到一个初步的
对数据得到一个初步的印象
其实很简单
我们就把它放到地图上去
就可以了
所以我们所说的隐性思维显性化
实际上就是把我们人的经验
因为有时候
你会有很多经验
但是你未必能表达出来
或者说你未必能以一种
用户能接受的方式表达出来
然后另外一个就是
把隐藏在数据之中有价值的信息
能直观地表达出来
帮助我们去做
进一步的分析和决策
这是例子之一
我们再看另外一个例子
这是我们去年
给天津做项目的时候
做的一个分析
他们想
就是天津市的政府它想了解
就是说天津市的公共设施
到底完善程度是怎么样的
所以我们也做了几个分析
比如说我们做这个公交站
公交站是不是能覆盖到
天津市的居民
那方法很简单
我们认为说
步行15分钟能到达公交站
就认为大家可以接受
我步行就去了
为什么15分钟呢
因为去年上海市发布了一个
社区的一个
第一个关于社区的一个
叫标准也好 叫什么也好
就它里面提到
一个叫15分钟生活圈的概念
现在大家都比较承认这个观点
就是一个公园 一个医院
或者说一个学校
如果15分钟我能走过去的话
大家是可以接受的
那这个也越来越成为说
我去评估公共设施
是否能覆盖到的一个标准
所以这里面选了15分钟
15分钟步行
那我们从这个结果来看的话
这个公交站点的覆盖
其实还是很完整的
基本上所有的小区都覆盖到了
我们再看幼儿园
那幼儿园的话
像这个红色的是
幼儿园的覆盖范围
然后这灰色的是居民用地
我们就发现幼儿园的覆盖
其实有很多小区是没有覆盖到的
而且这地方还有很多地方
是有重叠的
当然盖一个幼儿园
不像增加一个公交站点那么容易
所以这个确实也没有那么快能够
但是至少我们有一个结论说
幼儿园是需要去
是否考虑要增加的
包括这个社区医院
社区医院的覆盖来说
相对来说比幼儿园要好很多
它这种分析都很简单
其实就是一层窗户纸
我知道这样去分析了
我就能快速去得到这样的结论
这个也很有意思
这个是我
因为我们有一个
极海公共的一个平台
大家可以在上面去上传数据
去做一些图 去分享出来
这个大家看起来
应该是比较熟悉的
这个应该也是一个做城市规划的
一个用户去做的
这是哪呢 是西安
西安的古城墙
外边这一圈是它那古城墙的城墙
这个是城墙里边
就它做了一些
城墙里边的街道的
步行性 机动化 绿视率
和这个围合度的一些研究
然后把它放到地图上
因为我去过西安
然后在那个城墙上
还骑了一圈自行车
所以一看到这个我觉得很熟悉
就关注了一下
但是这个细一看的话
就发现有一些不太理解的地方
比如说可步行性
颜色越深的话
说明可步行性是越高的
像这个地方说明
就是这个角和这个角来说的话
这个地方的可步行性
应该是很高的 对吧
从它数据统计出来
但是不知道它数据是怎么统计
有可能是通过街景
有可能是通过什么
现场调查的方式去总结的
按理说可步行性高的地方
这个绿视率应该是更好的 对吧
但发现这个地方
绿视率反而没那么好
这个角的绿视率反而更好一些
机动化是差不多的
然后围合度
这个地方围合度的颜色
还略深一些
所以这个地方就让人觉得有点
数据是不是准
后来我还专门去打听了一下
原来ArcGIS
在西安的同事
我说怎么会
数据怎么会是这样的
后来跟我解释一通
我觉得也不太好接受
他说因为这个地方是圆的
这个地方是直角还是怎么回事
我觉得不太可接受
然后后来我去找遥感影像
找遥感影像的时候
我觉得还是发现了这个端倪在哪
因为这个地方是一个什么
这个地方是一个景点
广仁寺 是个寺庙
因为大家去那玩
是一个寺庙
大家都会去逛一逛
然后另外一个地方
这个地方可能
从这个街景上分析来说
可能这个地方
绿视率什么更好一些
但是这个地方看上去
因为没有POI
它看上去更像是
一个比较封闭的区域
然后我各种地方去放大看了一下
看上去应该是一个住宅
所以这地方 住宅了嘛
对于游人来说
肯定没有太大的吸引力的
所以这个地方
反而吸引的人流会更多一些
还有一些涉及到商业的
比如说我们一个用户
他是做地产咨询的
就是为房地产开发商服务
比如他告诉你说
你的目标用户在什么地方
在这个城市的什么地方
所以它这里面也会做
把它大量的分析成果放到地图上
后来我们跟这家
跟这个用户去沟通的时候
他们觉得这个好的地方在哪呢
就是我用这种方式跟他的客户
就是咨询公司跟房地产用户
去沟通的时候
比如说我的结论是这样的
它一看就明白了
原来就沟通的时候老会
就是他说是A他理解成B了
但是我们把它放到地图上来
这就很一目了然
所以他们现在会做大量的这种图
去给用户做交付
去做项目交付的时候
比如说讲到哪了
这个地方如果你有疑问
点个链接这图就出来了
甚至如果你想换一种分析方法
我们立马就可以去实施
所以这个让
确实是对于轻量级的这种地图
可视化工具
对于一些行业来讲的话
确实用得比较好
这个是我今天早上刚补充上来的
因为早上
我每天早上都会去看一下
用户发哪些图
这个是一个老师做的
他应该是给学生讲这个
它题目叫
地形地势对生产生活的影响
这条线大家可能了解过
叫胡焕庸线
其实就是
胡焕庸是我们国家的
一个地理学者
他在一九五几年的时候 应该是
一九五几年的时候
然后画了这样一条线
从哪呢 从黑龙江的黑河
到云南的腾冲
这条线很神奇
很神奇在哪呢
你看这个数据
应该是这个作者做的
它里面有
比如说这个是地形区
这个是降雨
你看降雨在这条线的那部分
然后这是粮食基地
这个是地震带
地震带都在那边
这是比较大的城市的分布
那这个
其实这条线提出来是哪呢
提出来是用来说
中国的人口分布的
当时一个结论就是说
在这条线的东南
大约占国土面积的36%
但是聚集了中国90%以上的人口
然后这个数据我还
后来我又找了一次
在2000年的时候
中国做了第五次的人口普查
然后又对这个普查的数据
又做了一个精确计算
就在这根线的东南方向
其实占国土面积43.8%
总人口达到94%
也就是说这不到一半的面积
其实90%都在这边 很神奇
当然人口是这样的
我们通过人口再去反推
发现其实很多都是这样的
包括这里面所说的
粮食的基地的分布
地震带的分布
包括降水的分布
所以这个说地形 地势
其实反而来说
我们觉得应该是
地形 地势来决定了
人口是这样去分布的
所以这条线很神奇
大家可以进一步了解一下
其实前面所说的这些所有的例子
其实都是在说数据可视化的价值
就是把一些不太容易直观表达的
或者隐藏的一些信息
通过这种可视化的方式
能直观表达出来
那对于可视化的价值
有一个在可视化领域的
一个大牛级的人物
叫Alberto Cairo
他也总结了一下
因为他做了很多这种
可视化的效果
包括媒体 包括出版等等
他就总结两点
可视化两个价值
一个就是阐述事实
增强表达和理解
就是要把我想表达的观点
让你一眼看上去就能理解
能get到
另外一个就是引导思考
你是不是有不同意见
你对哪有不同意见
我们可以进一步地探索
进一步地交流
后面这几章
其实也是考虑到大家
可能做一些课业实践的话
可能会用到一些可视化的技术
所以后面几张片子
把当前比较好的
一些可视化的工具
给大家罗列了一下
这快速过一下
第一个是一个图表库
这个是百度做的
百度做的一个Echarts
如果大家这里有人做开发的话
尤其是做一些前端的开发
应该会了解这个
这个是目前来说
至少在国内
在国内的这些相关的产品里面
互联网的产品
用图表 用这Echarts是很多的
现在它也
现在也是被收录到Apache
做一个开元项目在维护
确实做得很好
然后这里面大家可以看到说
虽然它是一个图表库
Echarts图表
但实际上图表里面
地图现在越来越成为
不可或缺的一部分
所以这里面会有很多
地图相关的功能
二维的 三维的
但是在这个定义里面
地图它是一种图表
那专门针对地图的
现在是以这个
做得非常好的是以Mapbox
Mapbox为代表的地图可视化库
这为什么叫库呢
因为它不是给大家
作为一个工具去用的
它是给开发者去用的
就是我要用这些库
可以做出很多的
关于地图相关的功能出来
那围绕在Mapbox周围的
像这个Carto
包括这个deck
deck.gl它是比较独立的
但是为了和Mapbox一起用的话
它能够跟它很好地去结合
用在一起
它是谁开发的呢
是Uber开发的
Uber有一个数据的实验室
它开发了这种可视效果
因为它最终的动力
就是要把Uber的车辆
放到地图上来
因为它量很大
它需要实时去调度
它需要去了解车在什么地方
帮助它做决策
所以它开发这样的东西
那国内来说的话
在这方面有两个
一个是阿里
其实高德现在也属于阿里的
一个大的体系
但是高德地图
在这方面也做了一些
可视化方面的一些研发
这个是它刚刚
应该是去年年底发布出来的
三维的
这个是跟高德地图
可以一起去用的
当然还有一些
阿里巴巴它自己做什么
也在做一些
但是它
那些是内部产品
不是给开发者去用的
开发者能用的是高德这个
所以这些都非常不错
大家如果以后做开发
都可以优先考虑采用这些技术
还有一些产品方面
产品方面比如说Tableau
Tableau就是传统的BI的产品
就No.1了
所以如果说这个BI的话
我们通常指BI软件
大家一般会这个
但是现在互联网嘛
大家很多也是在互联网
在云端也在
也有很多这种类似的产品出来
但是这个做的最经典
还是Tableau
但是这个商业智能
这是 因为这个商业智能
BI这个词很早了
因为这个产品也很长时间了
那现在我们理解智能
其实跟那个时候提的智能
又不太一样了
像这种传统的BI产品
更多提供的是一种
数据探索的一个功能
就是我有数据
我能够按照我的想法
把数据呈现出来
我自己去挖掘这方面的
里面的信息
那现在我们说智能更多的是
你能不能更聪明的给我一些结论
所以这个会有一些差异
还有一些比较小巧的
一些开元的产品
比如说GeoDa
这个大家也可以尝试一下
这也是一个开元产品
是一个大学
一个大学一个团队在维护的
也是专门针对地理数据
做一些分析 做可视化的
这个也非常好
而且支持的数据元也很丰富
还有一个就是Carto
那
对了 刚才忘了强调一下
就是前面的几个
都是开发者去用的
从这个开始都是
大家可以直接用它
这种工具型的软件
那Carto是
Mapbox是
前面介绍Mapbox
它是给大家去提供一些
基础的设施
提供地图工具
Carto它更多的是面向业务的
所以你看它的界面里面会有一些
各种的图表 地图相结合
其实它更贴近于具体的解决方案
这个也是
网上大家可以注册去用一下
也非常不错
当然极海也是一样
我们也在国内做
地理大数据方面的一个运产品
这是我们其中的一个产品
就是在线去制图
包括我前面去举的那些例子
那些地图的产品
其实都是通过这个工具来做的
那这里也总结一下
就是我觉得
就是可视化技术的一个发展趋势
第一个来说
就是地图会扮演
越来越重要的角色
就大家以前
以前没有特别关注这一方面
但是你看前面讲的那些
像BI软件它里面也有地图
包括我们去做一些图表
它也会提供地图的功能
所以地图越来越不可或缺
另外一个就是前端技术
会扮演越来越重要的角色
包括刚才我说Mapbox
或者高德
其实那些效果都是在浏览器
在前端就绘制出来了
第三个就是二维地图越来越向
二三维一体化的方式去发展
因为二维地图
大家用多了之后发现
有些信息是表达不出来的
你能不能把它 把这个
比如说把清华这个地方
给我立起来
让我表达出这个地方的
人的活跃度更高 对吧
北京市哪里的人去的地方更多
能不能让它给我立体起来
所以诸如此类需求会越来越多
所以二维地图慢慢开始
往二三维一体化来发展
另外就是矢量地图
开始向矢量和栅格一体化发展
所谓矢量地图就是一个点线面
我们前面介绍的一些案例
其实都是矢量的
所谓栅格就是遥感影像
那现在尤其是很火的
现在机器学习人工智能
很多是从图片
现在开始过度到影像上来
所以影像越来越
需求量越来越大
当然所有这些的话
就是之前大家
我做一些小的需求
我用一个图表库
我自己做一些开发能满足
但是数据越来越大之后
尤其是二维 三维
矢量 栅格等这些
反而这些解决方案
越来越需要一些
完整的平台来支撑
那前面只讲到了这个
就是第一个隐性思维显性化
所谓就是我们强调可视化的作用
那第二个我们来看一下
这个显性思维结构化
因为前面这些例子
大家也能体会出来
那些都是一些比较简单的场景
虽然能解决问题
但是不能解决所有问题
因为往往在一些具体的
一些需求 场景里面
尤其是我们做一些重要的决策
就像我第一个举那个例子
就是房价那个例子
实际上是我们给一个
金融贷款业务的用户做一个分析
我们涉及到很多钱的业务的时候
不会说我看一个地图
就能做决策了
所以需要更多的维度
比如说针对这个候选点
我们还需要考虑交通通达程度
客源流量 生活配套
等等等等很多方面
因为当时那个项目是什么呢
是把
有一家贷款方想把五棵松体育馆
复制一份到重庆去
那可行不可行
分析完之后大家觉得是Ok的
挺违反直觉的
所以我们考虑的因素有很多
有些场景
这里面举几个案例
就是我们给客户做的一些项目
这个项目是给
中国城市规划设计研究院去做的
这个是做什么呢
就是能不能把全国
因为城镇化这个词现在
包括整个国家的规划
其实都在围绕城镇化
来做一些决策
那我们能不能把全国主要城市
当前的城镇化的进程
能不能量化地描述出来
所以这个我们是
当时用两百多类指标
然后和客户一起
这里面有这客户的
行业知识在里面
用两百多类指标 一千多专题图
来对全国主要城市的城镇化
做一个评估
这里面会涉及到
很多有意思的环节
比如说当时想去评估一下
比如说这个城市内部的活跃程度
那怎么来评估呢
其实有很多种办法
比如说我去高德或者腾讯
我能够去采购一些数据
比如说微信
大家拿着微信去哪
人多的地方就活跃嘛 对吧
采完这些数据后又能做一些分析
那再比如说 当时想了一个
比较物美价廉的办法
什么呢
是不是大家认为
就是说道路越密的地方
可能活跃度更高
因为人的聚集
其实还是有偶然性的
比如这个地方有一个演唱会
可能这人就多了
没有演唱会人就少了
但是道路越密集的地方
一定说明它的活跃程度
是比较高的
所以当时就把全国的
路网数据里边的
十字路口提出来了
所以这些密密麻麻的
这些都是点 都是十字路口
然后用这些
把这些十字路口
做一个简单的空间计算
就把它放到一些
六边形的格子里边去
如果这格子里面的
十字路口多的话
我们就认为它会比较活跃
所以你看北京市的周边
统计出来是这样的
像这个地方是
这个地方是通州
这个地方是燕郊
然后出来之后
大家也觉得挺奇怪的
为什么燕郊比通州还要活跃
当然现在因为副中心
在通州正在建设
所以再过两年的话
这个地方可能就不一样了
那如果把全国的尺度
放到某一个省或者某一个市
其实我们方法论是一样的
只不过我们关注的指标
关注的数据来源会不一样
所以我们所说的结构化
其实也是指这方面
我们用结构化的数据
用结构化的指标去做一些定量
或者定性的一个比
一些评估
所以这里面大家可以看到说
数据的丰富程度是很丰富的
因为这也是我们大数据的一个
大家普遍认为的一个手段
就是我用更多的
多维的数据
去验证同一件事情
而不是用
在一个数据上继续做深挖
那这里面我们要强调一个
就是结构化的数据的价值
这里面也总结了三点
第一个就是说
我们去做很多
尤其像极海有数据团队
每天做的工作
其实就是在把数据进行结构化
这样带来的好处
第一个让数据更有条理
有更多维度
我们可以直接去用
另外一个我们去用的时候
就有更多的可能性
有更多的视角
第三个我觉得也很重要的
是什么呢
就是有这些结构化的数据之后
我们可以把领域的知识
贯穿到里边去
比如说同样是前边那个
像做城市的评估
其实换一个场景
好多数据其实是可以
在不同场景下去用的
比如说道路的数据
比如说人的数据
其实很多场景都可以用的
也可以用到零售
也可以用到选址 对吧
但是这里面不同的地方在哪呢
不同的地方在于
这里面所贯穿的领域知识
是不一样的
就是你前面做一个城市评估
一看这个城市规划就知道
这是我们领域的东西 对吧
所以领域知识就有了一个
有一个合适的载体
它能把这个
让数据在场景里边来落地
所以我们在很多工作里面
也会去做一些
这种结构化的数据
当然做结构化的数据
有时候会比较简单
做一些分类
做一些清洗和分类就可以了
但是有些时候
还是要费一些周折的
所以这个地方
你像举一个例子
就是我们如何对银行网点做评估
那现在银行
大家现在还去银行吗
很少
为什么
因为大家手机支付都很方便了
都不用花零钱了
身上都不用带零钱
谁还去银行干嘛
所以很多银行现在都是比较
年龄大的人去
因为他们可能不太会用手机
我就取个零花钱之类的
所以现在很多银行
其实在以前铺了那么多点
现在有的银行点其实不太需要了
那怎么评估 对吧
这一块区域里面有好几家银行
到底我留哪个 不留哪个
所以银行评估
这也是一个需求场景
那大家能想到的办法
就是我用一些指标来验证 对吧
我考虑人的覆盖
考虑企业的覆盖
考虑办公楼的覆盖等等等等
那这里面就有一个问题
那你这个范围是怎么去画的呢
那传统方式就画一个圆
方圆一公里 方圆两公里
这个是大家之前比较容易见到的
但实际上去用的时候
如果你较真的话
其实会有一些问题
比如说你银行在这 你家在这
你会跨过立交桥去这吗
其实不会的 对吧
不会的
就像我们公司在银谷大厦
就是保福寺桥这边
然后我们极少去
跨过四环去那边
比如说吃午饭什么的 对吧
因为它有一个天然的障碍
哪怕往这边走更远一点
我更愿意往五道口的方向走
所以像这种就有点太简单粗暴了
那有没有一些办法
来做一些更精细化的分析
有
后来大家发明了另外一种办法
就是既然一个圆太粗糙的话
那我们就有格子呗
我们可以用格子
去模拟一个真实的世界
原来我就画这么大一个圆
现在我可以一个格子
来理解它的边界了
这个是一个
我觉得是一个很大的进步
如果再形象一点来比喻的话
我们可以这样去理解
这是一幅蒙娜丽莎的画
是这样的
如果做成栅格的话是这样的
其实我们不看这个
我们看这个一眼也能看出来
是 对吧
肯定不会认为它是梵高的一个画
但是有很多细节被抹掉了
所以它只能是近似
当然我们可以把格子画得很小
画到一个像素
那就百分之百还原了
但是实际上是不太可能的
比如说把北京市
比如说一个像素
你就画成50米乘50米的格子
像北京这么大的城市
其实你的计算量要增加很多
而且这种格子也有一些不足
比如说你的格子从哪画的
如果是一幅画的话
它有一个边界你可以那样
如果是一个地理范围
比如说清华大学
你从哪作为左上角这个起点
如果我们在这格子里面
去统计人数的话
你这格子一半个格
那你这个格子里边人数变化
那可能就大了去了
再比如说像这个格子里面
它里面又有绿地 又有住宅
可能又有商业 还有铁路
还有一个环路
还有环路 对吧
它就变的很
就是不纯粹
让一个格子里面变的不纯粹
比如说我要去统计
把人我要分布到这个里边去的话
那你得到的结果一定是
绿地里边肯定也有人 对吧
所以为了解决这个问题
我的数据的同事
就想了一些解决方案
那能不能把这个格子
画得更纯粹一点
所以这里面就总结了几点
第一个其实物理世界里面
是有天然的这种阻隔的
比如说我刚才说的那个例子
四环
四环对于四环里边外边的人
来说的话
它就是一个天然的阻隔
再比如说铁路 桥
比如说河流
这种都是天然阻隔
然后用地性质
我更希望在同一个格子里面
用地性质是单一的
比如说我可以把清华大学
作为一个格子
对吧 作为一个格子
你别清学画一半 北大画一半
把这做成一个格子
这就不太好去做计算了
然后内部联系
就是我们认为
这一个格子里边的内部联系
是比较紧密的
而格子之间的流通
反而是有障碍的
所以最终我们去
起了这样一个概念 自然街区
当然自然街区
也不是我们发明的概念
其实规划里面就有这个概念
但是街区怎么画
之前有这概念
但是大家都不知道街区怎么画
就像画商圈一样
这个用户说商圈
我理想中商圈是这样的
他觉得商圈是那样的
就没有一个统一标准
所以最终我们选了
一个什么方式呢
既然我们希望一个格子内部
尽量的性质是一致的
希望考虑到天然的阻隔
那我们就去路网
我们就用路网
去把一个城市做切分
然后把内部道路和外部道路
给区分开来
然后考虑到河流 这个路桥
等等等等这些
把它所有这些结合起来之后
我们就可以把一个城市
做成这样的一种格子
那这样的话
你看河就是河 道路就是道路
那格子里面就是格子里面
你随便找到一个格子
可能这个地方就是一个公园
这个地方就是一个学校
这个地方就是一个住宅区
它就变得很纯粹
当然去做这样的计算的话
可能会产生大量的不合规的
比如说这格子过小
或者说格子过大
我们都需要用一些特殊的办法去
比如说把过小的合并
把更大的进一步去拆分
等等等等这些
但是一个大的原则就是
我们用自然的这种阻隔
去给它做拆分
把它形成大小适中的
这种城市单元
那如果有这个数据的话
如果我们有这样的数据
有这个作为载体的话
其实我们就能做很多事情
比如说我们可以统计任何一个
这种自然街区
或者叫Block里面的
比如说快餐店的数量
比如说幼儿园的数量
我们还可以做一些更有意思的
比如说我可以计算出来
从一个街区到任何一个街区的
驾车所消耗的时间
所有这些只要有位置的这些数据
我们都可以统计进来
那这样的话它就变成一个载体
大家如果比较理想化一点的话
这里面数据有你想要的各种数据
其实我们能做很多事情 对吧
那这个是
就是机器学习很火
然后我们同事也尝试去用
自然街景的数据去提取一些
比如说把建筑物的覆盖度
天空开阔度
包括这种绿化率等等这些数据
我们都把它提出来
提出来之后也把它放到这个
包括这种车辆的密度
提出来之后我们也把它放到
这种统计单元里边
那这样的话
我们按照某一个维度
去看街区的话
它就会有很多的维度
比如说这个颜色
可能是说颜色越深的地方
是不是建筑的覆盖度越高一些
越密集一些
然后浅的地方
天空的开阔度更高一些等等等等
那包括我们去计算
街区和街区之间
如果是步行 骑行 驾车等等
所消耗的时间
那如果有了这个之后
我们再去观察刚才场景的话
我们就可以更细腻一点
不是简单粗暴地
去画一个圆就好了
那同样的
我们用一个步行距离去算的时候
确实来说这个
确实走不过来
假如说我说10分钟
你从这地方 10分钟
绕过这个桥走过去 到不了
所以我们从这种分析
确实这些都在桥这边
那如果靠这种
就这种手段
再去评估这些网点的话
会更科学
这是一些结构化
那第三个阶段
就是结构思维智能化
但是说到智能
大家现在肯定会想到人工智能
但是我的理解
其实智能我觉得分两方面
主要 尤其是在一些实际的
比如说商业场景里面
解决问题就是
就足够智能
我原来需要半年时间做的事情
你现在一个月就做完了
也挺智能的
举个例子
比如说大家用百度地图 是吧
我去哪我要算一下最优路径
实际上这个东西
要靠人算的话
那确实很费劲的
但是计算机
你点一下它就告诉你了
它很快
尤其是现在什么呢
它甚至能做预测
基于历史的那些道路拥堵数据
能够做预测
就是说它告诉你
从这个地方到另外一个地方
它告诉你需要50分钟
这50分钟可不是
根据当前的路况算出来的
它是有一个
根据历史数据推演的
所以你看百度地图上边
手机上边
它线上还没有
手机上边它会有一个叫预测
就是你一旦选了一个路线之后
它会预测
预测你这个车行进的过程中
道路的路况应该是什么样子的
我还特意关注过几次
它那个时间还真是挺准的
有时候告诉你按照当前的路况
我觉得不需要50分钟
可能你开过去
还真是得那么长时间
所以这是从效率上边
另外一个就是
我觉得智能化上面就是说
我们更多的
通过数据来得出来一些结论
而不是靠人的经验
当然人的经验也不可或缺
但到现在为止
我们还没看到一个场景说
像AlphaGo一样
说下围棋很厉害 是吧
那像AlphaGo一样
比如说我要做一个大型超市选址
投资几个亿
你给我算一下
我到哪个地方投资一定能赚钱
现在还没有这样的方案
但是越来越多大家倾向于说
从更多的数据里面
去得出一些结论来帮助我做决策
这个现在是值得尝试
也可以去做的
所以在结构思维智能化这里面
我觉得更突出的就是说
我们能不能尽量让人少参与一些
让数据更多地参与一些
比如说这个
因为这个环节
其实有很多挺精彩的东西可以讲
但是这里面
因为一些商业项目的约束
这里面就没办法讲太细
只能讲一些大概的逻辑
像这个是我们给一个
这种大型的仓储式销售的
会员制的一个零售企业去做
他们想选址
因为他们
这是仓储式的嘛
像北京这么大的城市
他们也就开两到三家
像深圳这样的城市就开一家两家
像这样的
所以他就特别慎重
不像说便利蜂这种
我从公司到这两公里
我看见好几家便利蜂
因为它需要很密集地去覆盖
但是这种它不需要
所以它一旦开店
它的成本是很大的
所以就希望说
能不能借助这种数据
更智能地帮我去做一些决策
减少一些风险
他们的诉求就是说
我一旦选这
你能不能给我评估一下
我营业额会怎么样
或者会员数怎么样 对吧
包括像这个
这张图是我们给
也是一个比较大的
一个连锁快餐的零售企业
去做评估
就是评估营业额
它需要去评估每个店的营业额
当然它的好
它这个做的好处在于
你像前面那个我选一个之后
好坏就那样了
我不能把它推翻了再重新来了
那成本太大了
它这好处在于哪呢
它对已经开店的
因为快餐店它很多
对于已经开的这个店去做预测
它每个月都可以做
我这个月预测一下
到月底了我去验证一下
我这模型到底灵不灵
就不灵的话我再修正一下
我接着预测
然后这些预测模型达到一定的
他觉得满意了
我就可以拿它来去做选址
所以这个
所以不同的场景
玩法也不一样
所以这里面过多细节不说
就说一个大概思路
就是我们怎么去在一个
像前面说的
一个大型的零售的这种
一个城市开一两家 两三家这种
怎么去
大概一个思路
这里面有一个约束
就是我们希望说
用智能化的方法去做分析
但智能化方法大家都知道
智能化的方法
有一个先天条件
就是我必然需要大量的数据
你一个城市就两家店
全国就几十个城市
有总共不到一百家店
怎么做预测呢
一百家店的数据去告诉我
一个北京这么大城市
你开在东边还是西边
这不现实
那怎么来解决这个问题呢
其实这是一个什么
是训练数据量不足的一个问题
那怎么来解决呢
刚好我们因为之前做了
这个自然街区的数据
我们就换了一个思路
你不是店面不够吗
但是你会员够多
因为它是会员制的
就是你在它家消费
你必须要注册会员
但它一个城市的会员数量是有的
那我们做了一个
我觉得这个我们同事还很
我觉得这方面做得很聪明
他把会员的数据
放到这些自然街区里边去
比如说 Sorry
比如说像这张图
假设说这个店在这的话
那它的其他的会员分布
肯定是围绕离它更近的
会员越多的
当然也会覆盖到整个城市
它把它的会员按照它的住址
会分到这些自然街区里边去
那一下子一个城市里边的这些
样本量就多了
而且我样本量里边
还会有其他的一些数据
比如说商场的数量
宠物店的数量
因为它面向的消费的人群
相对高端一点
像宠物店这种 洗衣店这种
相关性会比较高
那这些数据再进去的话
样本量一下就多了
那这样的话
我们可以把全国
它所有店的这些会员
都分到这个街区里边去
那这样的话
我们把训练样本
从它的店面变成了啥
变成自然街区
然后把这个到店的距离
也作为一个因素考虑在里面
这样的话 全国就有
应该有几万的街区可以用了
这里面也做了一个尝试
就是尽量少地让人说
我去问用户说
你觉得哪些因素
和你的用户特征是比较匹配的
其实他也说不出来
所以这里面我们也做了一些
用POI的数据 用人的数据
去做了一些
做一个初步的分析
比如说我们分析出来
可能有100种或者80种
是比较相关的
那有一个初步之后
再用人在这里面去
经验再发挥点作用
顾虑到那些怎么想都不太可能的
不太靠谱地去掉一些
这样的话 特征的量也会上来
因为靠经验在里面
这个量不会太多
所以这种特征工程的话
就是说我们把每个街区里边
我们觉得哪些特征
跟它的用户是相关的
得把这些特征提取出来
那这样的话
每一个街区就变成了一个
带有这种特征指标的
一些训练样本
那我们把这些
再拿一些模型去做训练
那这里面举个例子
比如说随机森林
去做训练
训练完了之后
把我们得出来的这个模型
再去做预测的话
我们能得到一个什么样的结果呢
就是我在城市的任何一个地方
假设说你想在这个地方开店
我能预测一下在这个城市里面
在每个街区里面会有多少会员
那这样的话
通过会员数来间接地去推算
可能的营业额
那这个其实整个思路就通了
当然这里面
不会像我说的这么简单
几句话把这个过程就说清楚了
中间要进行大量的
这种模型的实验
然后参数的调试等等的
包括用什么样的数据去参与计算
所以挺复杂的一个过程
但最终我们得到一个结果
是这样的
我们交付的结果就是
你在城市里面点任何一个点
我告诉你
你的会员分布是
大概是一个什么样子的
总结一下
其实今天说了很多
一些场景化的
一些故事 一些案例
其实还是想强调说
大家后面如果以后工作中
或者学习中
遇到一些要解决的问题
可以考虑一下
我通过地理维度
能不能帮我更快地来解决问题
更好地解决问题
那这里第一个来说的话
首先你得考虑有没有数据
没数据那这些都没用
然后最后我们把我们一般做
针对一个特定的需求
怎么去做分析
一个套路给大家讲了一下
就是隐性思维显性化
其实就是怎么用可视化
去解决一般性的问题
或者做一些初步的数据探索
再一个就是结构化
我们用这种指标化的
然后把这种领域知识
专家系统的经验放到里面
做一些定性 定量的评估
那第三步就是说
我们希望更智能地
去做决策的时候
我们希望能从数据里面
挖掘更多的信息出来
那我们就需要更多的这种
多维的数据
包括就用一些
目前比较流行的模型
然后去达到这种辅助决策的作用
Ok 今天内容就这些
好 谢谢大家
-1.1 城市及城市科学的发展演变
--课程视频
-1.2 新城市科学的提出
--课程视频
-1.3 相关研究机构 、期刊和课程
--课程视频
-1.4 变化中的城市
--课程视频
-课程讲义
-课后讨论
-课后练习1
-2.1 城市概念的定义
--课程视频
-2.2 城市正在发生的变化:驱动力
--课程视频
-2.3 城市正在发生的变化:产品/服务
--课程视频
-2.4 城市正在发生的变化:城市空间
--课程视频
-课程讲义
-课外阅读
-课后讨论
-课后练习2
-3.1 为什么强调地理思维
--课程视频
-3.2 地理思维应用的基础
--课程视频
-3.3 如何应用地理思维
--课程视频
-3.4 课堂提问
--课程视频
-课程讲义
-课外阅读
-课后讨论
-课后练习3
-4.1 我所理解的新城市科学
--课程视频
-4.2 新城市科学的机遇
--课程视频
-4.3 新城市科学下的规划治理
--课程视频
-4.4 新城市科学下的社区实践
--课程视频
-课程讲义
-课外阅读
-课后讨论
-课后练习4
-5.1 从数字孪生到数字孪生城市
--课程视频
-5.2 数字孪生城市的系统认知
--课程视频
-5.3 数字孪生城市的实践突破
--课程视频
-课程讲义
-课外阅读
-课后讨论
-课后练习5
-6.1 前言
--课程视频
-6.2 机器学习
--课程视频
-6.3 深度学习
--课程视频
-6.4 城市科学当中的应用
--课程视频
-6.5 课堂提问
--课程视频
-课程讲义
-课外阅读
-课后讨论
-课后练习6
-7.1 前言
--课程视频
-7.2 物联网(1)
--课程视频
-7.3 物联网(2)
--课程视频
-7.4 基于物联网的相关案例
--课程视频
-7.5 基于穿戴式设备的相关案例
--课程视频
-课程讲义
-课外阅读
-课后讨论
-课后练习7
-8.1 前言
--课程视频
-8.2 智慧城市:ICT技术驱动的空间变革
--课程视频
-8.3 智慧城市:从大脑到神经系统的改造之路
--课程视频
-8.4 城市数据:从问题洞察到管理与运营工具
--课程视频
-8.5 课堂提问
--课程视频
-课程讲义
-课外阅读
-课后讨论
-课后练习8
-9.1 数据介绍
--课程视频
-9.2 商圈识别、分类与评价
--课程视频
-9.3 项目介绍与产品升级
--课程视频
-9.4 课堂提问
--课程视频
-课程讲义
-课外阅读
-课后讨论
-课后练习9
-10.1 人本尺度城市形态:定义
--课程视频
-10.2 人本尺度城市形态:理论
--课程视频
-10.3 人本尺度城市形态:方法
--课程视频
-课程讲义
-课外阅读
-课后讨论
-课后练习10
-11.1 大数据+城市科学
--课程视频
-11.2 计算社会科学:方法论
--课程视频
-11.3 计算社会科学:方法与议题
--课程视频
-11.4 计算社会科学:前沿应用
--课程视频
-课程讲义
-课后讨论
-课外阅读
-课后练习11
-12.1 未来城市:空间干预与数字创新
--课程视频
-12.2 未来城市:认识论和方法论
--课程视频
-12.3 案例分享
--课程视频
-课程讲义
-课后讨论
-课外阅读
-课后练习12
-课程视频
-课后讨论