当前课程知识点:新城市科学 >  3. 地理数据分析、可视化与商业智能 >  3.3 如何应用地理思维 >  课程视频

返回《新城市科学》慕课在线视频课程列表

课程视频在线视频

下一节:课程视频

返回《新城市科学》慕课在线视频列表

课程视频课程教案、知识点、字幕

那具体到怎么去应用数据的话

我们经过这几年的实践

也总结了一些套路

三个方面

那这个方面也是根据

场景的复杂的程度

然后有一个递进的关系

我们一一来看一下

简单来说就是隐性思维显性化

显性思维结构化

结构思维智能化

先看第一个 隐性思维显性化

这个怎么来理解呢

也举个例子

比如说房价的数据

我们一些用户里面

很多都会用到房价数据

比如说像房地产开发商

或者做房地产 做一些咨询

或者说一些

做一些贷款金融业务

要去评估一个项目风险的时候

都会利用到房价的数据

那往往 以往的时候

我们去看房价的数据

更多的是一张表格

告诉你哪个小区多少钱 是吧

这样其实不是很直观

所以我们把它放到地图上

一下就明晰了

至少说我们知道这些价钱

在一个城市里面是怎么分布的

这是重庆市

这是当时我们的一个

金融贷款的一个项目的数据

当然这个还不是

大家只能看到说

Ok 这些房价数据是分布在哪的

不知道哪个地方房价高 房价低

那我们再加一个维度

比如说我们就按照房价高低

然后用一些形状 用一些尺寸

用一些圆圈尺寸和颜色

把它表达出来

就一目了然了

你看这个地方

市中心的地方

肯定是房价比较高的 对吧

但是你看这个地方

这是当时我们用户

他的一个带评估项目的地点

发现这个地方房价其实也挺高的

虽然离市中心是有点距离了

所以说从这个地方

从一个表格到这样的一个

我们得到一个初步的

对数据得到一个初步的印象

其实很简单

我们就把它放到地图上去

就可以了

所以我们所说的隐性思维显性化

实际上就是把我们人的经验

因为有时候

你会有很多经验

但是你未必能表达出来

或者说你未必能以一种

用户能接受的方式表达出来

然后另外一个就是

把隐藏在数据之中有价值的信息

能直观地表达出来

帮助我们去做

进一步的分析和决策

这是例子之一

我们再看另外一个例子

这是我们去年

给天津做项目的时候

做的一个分析

他们想

就是天津市的政府它想了解

就是说天津市的公共设施

到底完善程度是怎么样的

所以我们也做了几个分析

比如说我们做这个公交站

公交站是不是能覆盖到

天津市的居民

那方法很简单

我们认为说

步行15分钟能到达公交站

就认为大家可以接受

我步行就去了

为什么15分钟呢

因为去年上海市发布了一个

社区的一个

第一个关于社区的一个

叫标准也好 叫什么也好

就它里面提到

一个叫15分钟生活圈的概念

现在大家都比较承认这个观点

就是一个公园 一个医院

或者说一个学校

如果15分钟我能走过去的话

大家是可以接受的

那这个也越来越成为说

我去评估公共设施

是否能覆盖到的一个标准

所以这里面选了15分钟

15分钟步行

那我们从这个结果来看的话

这个公交站点的覆盖

其实还是很完整的

基本上所有的小区都覆盖到了

我们再看幼儿园

那幼儿园的话

像这个红色的是

幼儿园的覆盖范围

然后这灰色的是居民用地

我们就发现幼儿园的覆盖

其实有很多小区是没有覆盖到的

而且这地方还有很多地方

是有重叠的

当然盖一个幼儿园

不像增加一个公交站点那么容易

所以这个确实也没有那么快能够

但是至少我们有一个结论说

幼儿园是需要去

是否考虑要增加的

包括这个社区医院

社区医院的覆盖来说

相对来说比幼儿园要好很多

它这种分析都很简单

其实就是一层窗户纸

我知道这样去分析了

我就能快速去得到这样的结论

这个也很有意思

这个是我

因为我们有一个

极海公共的一个平台

大家可以在上面去上传数据

去做一些图 去分享出来

这个大家看起来

应该是比较熟悉的

这个应该也是一个做城市规划的

一个用户去做的

这是哪呢 是西安

西安的古城墙

外边这一圈是它那古城墙的城墙

这个是城墙里边

就它做了一些

城墙里边的街道的

步行性 机动化 绿视率

和这个围合度的一些研究

然后把它放到地图上

因为我去过西安

然后在那个城墙上

还骑了一圈自行车

所以一看到这个我觉得很熟悉

就关注了一下

但是这个细一看的话

就发现有一些不太理解的地方

比如说可步行性

颜色越深的话

说明可步行性是越高的

像这个地方说明

就是这个角和这个角来说的话

这个地方的可步行性

应该是很高的 对吧

从它数据统计出来

但是不知道它数据是怎么统计

有可能是通过街景

有可能是通过什么

现场调查的方式去总结的

按理说可步行性高的地方

这个绿视率应该是更好的 对吧

但发现这个地方

绿视率反而没那么好

这个角的绿视率反而更好一些

机动化是差不多的

然后围合度

这个地方围合度的颜色

还略深一些

所以这个地方就让人觉得有点

数据是不是准

后来我还专门去打听了一下

原来ArcGIS

在西安的同事

我说怎么会

数据怎么会是这样的

后来跟我解释一通

我觉得也不太好接受

他说因为这个地方是圆的

这个地方是直角还是怎么回事

我觉得不太可接受

然后后来我去找遥感影像

找遥感影像的时候

我觉得还是发现了这个端倪在哪

因为这个地方是一个什么

这个地方是一个景点

广仁寺 是个寺庙

因为大家去那玩

是一个寺庙

大家都会去逛一逛

然后另外一个地方

这个地方可能

从这个街景上分析来说

可能这个地方

绿视率什么更好一些

但是这个地方看上去

因为没有POI

它看上去更像是

一个比较封闭的区域

然后我各种地方去放大看了一下

看上去应该是一个住宅

所以这地方 住宅了嘛

对于游人来说

肯定没有太大的吸引力的

所以这个地方

反而吸引的人流会更多一些

还有一些涉及到商业的

比如说我们一个用户

他是做地产咨询的

就是为房地产开发商服务

比如他告诉你说

你的目标用户在什么地方

在这个城市的什么地方

所以它这里面也会做

把它大量的分析成果放到地图上

后来我们跟这家

跟这个用户去沟通的时候

他们觉得这个好的地方在哪呢

就是我用这种方式跟他的客户

就是咨询公司跟房地产用户

去沟通的时候

比如说我的结论是这样的

它一看就明白了

原来就沟通的时候老会

就是他说是A他理解成B了

但是我们把它放到地图上来

这就很一目了然

所以他们现在会做大量的这种图

去给用户做交付

去做项目交付的时候

比如说讲到哪了

这个地方如果你有疑问

点个链接这图就出来了

甚至如果你想换一种分析方法

我们立马就可以去实施

所以这个让

确实是对于轻量级的这种地图

可视化工具

对于一些行业来讲的话

确实用得比较好

这个是我今天早上刚补充上来的

因为早上

我每天早上都会去看一下

用户发哪些图

这个是一个老师做的

他应该是给学生讲这个

它题目叫

地形地势对生产生活的影响

这条线大家可能了解过

叫胡焕庸线

其实就是

胡焕庸是我们国家的

一个地理学者

他在一九五几年的时候 应该是

一九五几年的时候

然后画了这样一条线

从哪呢 从黑龙江的黑河

到云南的腾冲

这条线很神奇

很神奇在哪呢

你看这个数据

应该是这个作者做的

它里面有

比如说这个是地形区

这个是降雨

你看降雨在这条线的那部分

然后这是粮食基地

这个是地震带

地震带都在那边

这是比较大的城市的分布

那这个

其实这条线提出来是哪呢

提出来是用来说

中国的人口分布的

当时一个结论就是说

在这条线的东南

大约占国土面积的36%

但是聚集了中国90%以上的人口

然后这个数据我还

后来我又找了一次

在2000年的时候

中国做了第五次的人口普查

然后又对这个普查的数据

又做了一个精确计算

就在这根线的东南方向

其实占国土面积43.8%

总人口达到94%

也就是说这不到一半的面积

其实90%都在这边 很神奇

当然人口是这样的

我们通过人口再去反推

发现其实很多都是这样的

包括这里面所说的

粮食的基地的分布

地震带的分布

包括降水的分布

所以这个说地形 地势

其实反而来说

我们觉得应该是

地形 地势来决定了

人口是这样去分布的

所以这条线很神奇

大家可以进一步了解一下

其实前面所说的这些所有的例子

其实都是在说数据可视化的价值

就是把一些不太容易直观表达的

或者隐藏的一些信息

通过这种可视化的方式

能直观表达出来

那对于可视化的价值

有一个在可视化领域的

一个大牛级的人物

叫Alberto Cairo

他也总结了一下

因为他做了很多这种

可视化的效果

包括媒体 包括出版等等

他就总结两点

可视化两个价值

一个就是阐述事实

增强表达和理解

就是要把我想表达的观点

让你一眼看上去就能理解

能get到

另外一个就是引导思考

你是不是有不同意见

你对哪有不同意见

我们可以进一步地探索

进一步地交流

后面这几章

其实也是考虑到大家

可能做一些课业实践的话

可能会用到一些可视化的技术

所以后面几张片子

把当前比较好的

一些可视化的工具

给大家罗列了一下

这快速过一下

第一个是一个图表库

这个是百度做的

百度做的一个Echarts

如果大家这里有人做开发的话

尤其是做一些前端的开发

应该会了解这个

这个是目前来说

至少在国内

在国内的这些相关的产品里面

互联网的产品

用图表 用这Echarts是很多的

现在它也

现在也是被收录到Apache

做一个开元项目在维护

确实做得很好

然后这里面大家可以看到说

虽然它是一个图表库

Echarts图表

但实际上图表里面

地图现在越来越成为

不可或缺的一部分

所以这里面会有很多

地图相关的功能

二维的 三维的

但是在这个定义里面

地图它是一种图表

那专门针对地图的

现在是以这个

做得非常好的是以Mapbox

Mapbox为代表的地图可视化库

这为什么叫库呢

因为它不是给大家

作为一个工具去用的

它是给开发者去用的

就是我要用这些库

可以做出很多的

关于地图相关的功能出来

那围绕在Mapbox周围的

像这个Carto

包括这个deck

deck.gl它是比较独立的

但是为了和Mapbox一起用的话

它能够跟它很好地去结合

用在一起

它是谁开发的呢

是Uber开发的

Uber有一个数据的实验室

它开发了这种可视效果

因为它最终的动力

就是要把Uber的车辆

放到地图上来

因为它量很大

它需要实时去调度

它需要去了解车在什么地方

帮助它做决策

所以它开发这样的东西

那国内来说的话

在这方面有两个

一个是阿里

其实高德现在也属于阿里的

一个大的体系

但是高德地图

在这方面也做了一些

可视化方面的一些研发

这个是它刚刚

应该是去年年底发布出来的

三维的

这个是跟高德地图

可以一起去用的

当然还有一些

阿里巴巴它自己做什么

也在做一些

但是它

那些是内部产品

不是给开发者去用的

开发者能用的是高德这个

所以这些都非常不错

大家如果以后做开发

都可以优先考虑采用这些技术

还有一些产品方面

产品方面比如说Tableau

Tableau就是传统的BI的产品

就No.1了

所以如果说这个BI的话

我们通常指BI软件

大家一般会这个

但是现在互联网嘛

大家很多也是在互联网

在云端也在

也有很多这种类似的产品出来

但是这个做的最经典

还是Tableau

但是这个商业智能

这是 因为这个商业智能

BI这个词很早了

因为这个产品也很长时间了

那现在我们理解智能

其实跟那个时候提的智能

又不太一样了

像这种传统的BI产品

更多提供的是一种

数据探索的一个功能

就是我有数据

我能够按照我的想法

把数据呈现出来

我自己去挖掘这方面的

里面的信息

那现在我们说智能更多的是

你能不能更聪明的给我一些结论

所以这个会有一些差异

还有一些比较小巧的

一些开元的产品

比如说GeoDa

这个大家也可以尝试一下

这也是一个开元产品

是一个大学

一个大学一个团队在维护的

也是专门针对地理数据

做一些分析 做可视化的

这个也非常好

而且支持的数据元也很丰富

还有一个就是Carto

对了 刚才忘了强调一下

就是前面的几个

都是开发者去用的

从这个开始都是

大家可以直接用它

这种工具型的软件

那Carto是

Mapbox是

前面介绍Mapbox

它是给大家去提供一些

基础的设施

提供地图工具

Carto它更多的是面向业务的

所以你看它的界面里面会有一些

各种的图表 地图相结合

其实它更贴近于具体的解决方案

这个也是

网上大家可以注册去用一下

也非常不错

当然极海也是一样

我们也在国内做

地理大数据方面的一个运产品

这是我们其中的一个产品

就是在线去制图

包括我前面去举的那些例子

那些地图的产品

其实都是通过这个工具来做的

那这里也总结一下

就是我觉得

就是可视化技术的一个发展趋势

第一个来说

就是地图会扮演

越来越重要的角色

就大家以前

以前没有特别关注这一方面

但是你看前面讲的那些

像BI软件它里面也有地图

包括我们去做一些图表

它也会提供地图的功能

所以地图越来越不可或缺

另外一个就是前端技术

会扮演越来越重要的角色

包括刚才我说Mapbox

或者高德

其实那些效果都是在浏览器

在前端就绘制出来了

第三个就是二维地图越来越向

二三维一体化的方式去发展

因为二维地图

大家用多了之后发现

有些信息是表达不出来的

你能不能把它 把这个

比如说把清华这个地方

给我立起来

让我表达出这个地方的

人的活跃度更高 对吧

北京市哪里的人去的地方更多

能不能让它给我立体起来

所以诸如此类需求会越来越多

所以二维地图慢慢开始

往二三维一体化来发展

另外就是矢量地图

开始向矢量和栅格一体化发展

所谓矢量地图就是一个点线面

我们前面介绍的一些案例

其实都是矢量的

所谓栅格就是遥感影像

那现在尤其是很火的

现在机器学习人工智能

很多是从图片

现在开始过度到影像上来

所以影像越来越

需求量越来越大

当然所有这些的话

就是之前大家

我做一些小的需求

我用一个图表库

我自己做一些开发能满足

但是数据越来越大之后

尤其是二维 三维

矢量 栅格等这些

反而这些解决方案

越来越需要一些

完整的平台来支撑

那前面只讲到了这个

就是第一个隐性思维显性化

所谓就是我们强调可视化的作用

那第二个我们来看一下

这个显性思维结构化

因为前面这些例子

大家也能体会出来

那些都是一些比较简单的场景

虽然能解决问题

但是不能解决所有问题

因为往往在一些具体的

一些需求 场景里面

尤其是我们做一些重要的决策

就像我第一个举那个例子

就是房价那个例子

实际上是我们给一个

金融贷款业务的用户做一个分析

我们涉及到很多钱的业务的时候

不会说我看一个地图

就能做决策了

所以需要更多的维度

比如说针对这个候选点

我们还需要考虑交通通达程度

客源流量 生活配套

等等等等很多方面

因为当时那个项目是什么呢

是把

有一家贷款方想把五棵松体育馆

复制一份到重庆去

那可行不可行

分析完之后大家觉得是Ok的

挺违反直觉的

所以我们考虑的因素有很多

有些场景

这里面举几个案例

就是我们给客户做的一些项目

这个项目是给

中国城市规划设计研究院去做的

这个是做什么呢

就是能不能把全国

因为城镇化这个词现在

包括整个国家的规划

其实都在围绕城镇化

来做一些决策

那我们能不能把全国主要城市

当前的城镇化的进程

能不能量化地描述出来

所以这个我们是

当时用两百多类指标

然后和客户一起

这里面有这客户的

行业知识在里面

用两百多类指标 一千多专题图

来对全国主要城市的城镇化

做一个评估

这里面会涉及到

很多有意思的环节

比如说当时想去评估一下

比如说这个城市内部的活跃程度

那怎么来评估呢

其实有很多种办法

比如说我去高德或者腾讯

我能够去采购一些数据

比如说微信

大家拿着微信去哪

人多的地方就活跃嘛 对吧

采完这些数据后又能做一些分析

那再比如说 当时想了一个

比较物美价廉的办法

什么呢

是不是大家认为

就是说道路越密的地方

可能活跃度更高

因为人的聚集

其实还是有偶然性的

比如这个地方有一个演唱会

可能这人就多了

没有演唱会人就少了

但是道路越密集的地方

一定说明它的活跃程度

是比较高的

所以当时就把全国的

路网数据里边的

十字路口提出来了

所以这些密密麻麻的

这些都是点 都是十字路口

然后用这些

把这些十字路口

做一个简单的空间计算

就把它放到一些

六边形的格子里边去

如果这格子里面的

十字路口多的话

我们就认为它会比较活跃

所以你看北京市的周边

统计出来是这样的

像这个地方是

这个地方是通州

这个地方是燕郊

然后出来之后

大家也觉得挺奇怪的

为什么燕郊比通州还要活跃

当然现在因为副中心

在通州正在建设

所以再过两年的话

这个地方可能就不一样了

那如果把全国的尺度

放到某一个省或者某一个市

其实我们方法论是一样的

只不过我们关注的指标

关注的数据来源会不一样

所以我们所说的结构化

其实也是指这方面

我们用结构化的数据

用结构化的指标去做一些定量

或者定性的一个比

一些评估

所以这里面大家可以看到说

数据的丰富程度是很丰富的

因为这也是我们大数据的一个

大家普遍认为的一个手段

就是我用更多的

多维的数据

去验证同一件事情

而不是用

在一个数据上继续做深挖

那这里面我们要强调一个

就是结构化的数据的价值

这里面也总结了三点

第一个就是说

我们去做很多

尤其像极海有数据团队

每天做的工作

其实就是在把数据进行结构化

这样带来的好处

第一个让数据更有条理

有更多维度

我们可以直接去用

另外一个我们去用的时候

就有更多的可能性

有更多的视角

第三个我觉得也很重要的

是什么呢

就是有这些结构化的数据之后

我们可以把领域的知识

贯穿到里边去

比如说同样是前边那个

像做城市的评估

其实换一个场景

好多数据其实是可以

在不同场景下去用的

比如说道路的数据

比如说人的数据

其实很多场景都可以用的

也可以用到零售

也可以用到选址 对吧

但是这里面不同的地方在哪呢

不同的地方在于

这里面所贯穿的领域知识

是不一样的

就是你前面做一个城市评估

一看这个城市规划就知道

这是我们领域的东西 对吧

所以领域知识就有了一个

有一个合适的载体

它能把这个

让数据在场景里边来落地

所以我们在很多工作里面

也会去做一些

这种结构化的数据

当然做结构化的数据

有时候会比较简单

做一些分类

做一些清洗和分类就可以了

但是有些时候

还是要费一些周折的

所以这个地方

你像举一个例子

就是我们如何对银行网点做评估

那现在银行

大家现在还去银行吗

很少

为什么

因为大家手机支付都很方便了

都不用花零钱了

身上都不用带零钱

谁还去银行干嘛

所以很多银行现在都是比较

年龄大的人去

因为他们可能不太会用手机

我就取个零花钱之类的

所以现在很多银行

其实在以前铺了那么多点

现在有的银行点其实不太需要了

那怎么评估 对吧

这一块区域里面有好几家银行

到底我留哪个 不留哪个

所以银行评估

这也是一个需求场景

那大家能想到的办法

就是我用一些指标来验证 对吧

我考虑人的覆盖

考虑企业的覆盖

考虑办公楼的覆盖等等等等

那这里面就有一个问题

那你这个范围是怎么去画的呢

那传统方式就画一个圆

方圆一公里 方圆两公里

这个是大家之前比较容易见到的

但实际上去用的时候

如果你较真的话

其实会有一些问题

比如说你银行在这 你家在这

你会跨过立交桥去这吗

其实不会的 对吧

不会的

就像我们公司在银谷大厦

就是保福寺桥这边

然后我们极少去

跨过四环去那边

比如说吃午饭什么的 对吧

因为它有一个天然的障碍

哪怕往这边走更远一点

我更愿意往五道口的方向走

所以像这种就有点太简单粗暴了

那有没有一些办法

来做一些更精细化的分析

后来大家发明了另外一种办法

就是既然一个圆太粗糙的话

那我们就有格子呗

我们可以用格子

去模拟一个真实的世界

原来我就画这么大一个圆

现在我可以一个格子

来理解它的边界了

这个是一个

我觉得是一个很大的进步

如果再形象一点来比喻的话

我们可以这样去理解

这是一幅蒙娜丽莎的画

是这样的

如果做成栅格的话是这样的

其实我们不看这个

我们看这个一眼也能看出来

是 对吧

肯定不会认为它是梵高的一个画

但是有很多细节被抹掉了

所以它只能是近似

当然我们可以把格子画得很小

画到一个像素

那就百分之百还原了

但是实际上是不太可能的

比如说把北京市

比如说一个像素

你就画成50米乘50米的格子

像北京这么大的城市

其实你的计算量要增加很多

而且这种格子也有一些不足

比如说你的格子从哪画的

如果是一幅画的话

它有一个边界你可以那样

如果是一个地理范围

比如说清华大学

你从哪作为左上角这个起点

如果我们在这格子里面

去统计人数的话

你这格子一半个格

那你这个格子里边人数变化

那可能就大了去了

再比如说像这个格子里面

它里面又有绿地 又有住宅

可能又有商业 还有铁路

还有一个环路

还有环路 对吧

它就变的很

就是不纯粹

让一个格子里面变的不纯粹

比如说我要去统计

把人我要分布到这个里边去的话

那你得到的结果一定是

绿地里边肯定也有人 对吧

所以为了解决这个问题

我的数据的同事

就想了一些解决方案

那能不能把这个格子

画得更纯粹一点

所以这里面就总结了几点

第一个其实物理世界里面

是有天然的这种阻隔的

比如说我刚才说的那个例子

四环

四环对于四环里边外边的人

来说的话

它就是一个天然的阻隔

再比如说铁路 桥

比如说河流

这种都是天然阻隔

然后用地性质

我更希望在同一个格子里面

用地性质是单一的

比如说我可以把清华大学

作为一个格子

对吧 作为一个格子

你别清学画一半 北大画一半

把这做成一个格子

这就不太好去做计算了

然后内部联系

就是我们认为

这一个格子里边的内部联系

是比较紧密的

而格子之间的流通

反而是有障碍的

所以最终我们去

起了这样一个概念 自然街区

当然自然街区

也不是我们发明的概念

其实规划里面就有这个概念

但是街区怎么画

之前有这概念

但是大家都不知道街区怎么画

就像画商圈一样

这个用户说商圈

我理想中商圈是这样的

他觉得商圈是那样的

就没有一个统一标准

所以最终我们选了

一个什么方式呢

既然我们希望一个格子内部

尽量的性质是一致的

希望考虑到天然的阻隔

那我们就去路网

我们就用路网

去把一个城市做切分

然后把内部道路和外部道路

给区分开来

然后考虑到河流 这个路桥

等等等等这些

把它所有这些结合起来之后

我们就可以把一个城市

做成这样的一种格子

那这样的话

你看河就是河 道路就是道路

那格子里面就是格子里面

你随便找到一个格子

可能这个地方就是一个公园

这个地方就是一个学校

这个地方就是一个住宅区

它就变得很纯粹

当然去做这样的计算的话

可能会产生大量的不合规的

比如说这格子过小

或者说格子过大

我们都需要用一些特殊的办法去

比如说把过小的合并

把更大的进一步去拆分

等等等等这些

但是一个大的原则就是

我们用自然的这种阻隔

去给它做拆分

把它形成大小适中的

这种城市单元

那如果有这个数据的话

如果我们有这样的数据

有这个作为载体的话

其实我们就能做很多事情

比如说我们可以统计任何一个

这种自然街区

或者叫Block里面的

比如说快餐店的数量

比如说幼儿园的数量

我们还可以做一些更有意思的

比如说我可以计算出来

从一个街区到任何一个街区的

驾车所消耗的时间

所有这些只要有位置的这些数据

我们都可以统计进来

那这样的话它就变成一个载体

大家如果比较理想化一点的话

这里面数据有你想要的各种数据

其实我们能做很多事情 对吧

那这个是

就是机器学习很火

然后我们同事也尝试去用

自然街景的数据去提取一些

比如说把建筑物的覆盖度

天空开阔度

包括这种绿化率等等这些数据

我们都把它提出来

提出来之后也把它放到这个

包括这种车辆的密度

提出来之后我们也把它放到

这种统计单元里边

那这样的话

我们按照某一个维度

去看街区的话

它就会有很多的维度

比如说这个颜色

可能是说颜色越深的地方

是不是建筑的覆盖度越高一些

越密集一些

然后浅的地方

天空的开阔度更高一些等等等等

那包括我们去计算

街区和街区之间

如果是步行 骑行 驾车等等

所消耗的时间

那如果有了这个之后

我们再去观察刚才场景的话

我们就可以更细腻一点

不是简单粗暴地

去画一个圆就好了

那同样的

我们用一个步行距离去算的时候

确实来说这个

确实走不过来

假如说我说10分钟

你从这地方 10分钟

绕过这个桥走过去 到不了

所以我们从这种分析

确实这些都在桥这边

那如果靠这种

就这种手段

再去评估这些网点的话

会更科学

这是一些结构化

那第三个阶段

就是结构思维智能化

但是说到智能

大家现在肯定会想到人工智能

但是我的理解

其实智能我觉得分两方面

主要 尤其是在一些实际的

比如说商业场景里面

解决问题就是

就足够智能

我原来需要半年时间做的事情

你现在一个月就做完了

也挺智能的

举个例子

比如说大家用百度地图 是吧

我去哪我要算一下最优路径

实际上这个东西

要靠人算的话

那确实很费劲的

但是计算机

你点一下它就告诉你了

它很快

尤其是现在什么呢

它甚至能做预测

基于历史的那些道路拥堵数据

能够做预测

就是说它告诉你

从这个地方到另外一个地方

它告诉你需要50分钟

这50分钟可不是

根据当前的路况算出来的

它是有一个

根据历史数据推演的

所以你看百度地图上边

手机上边

它线上还没有

手机上边它会有一个叫预测

就是你一旦选了一个路线之后

它会预测

预测你这个车行进的过程中

道路的路况应该是什么样子的

我还特意关注过几次

它那个时间还真是挺准的

有时候告诉你按照当前的路况

我觉得不需要50分钟

可能你开过去

还真是得那么长时间

所以这是从效率上边

另外一个就是

我觉得智能化上面就是说

我们更多的

通过数据来得出来一些结论

而不是靠人的经验

当然人的经验也不可或缺

但到现在为止

我们还没看到一个场景说

像AlphaGo一样

说下围棋很厉害 是吧

那像AlphaGo一样

比如说我要做一个大型超市选址

投资几个亿

你给我算一下

我到哪个地方投资一定能赚钱

现在还没有这样的方案

但是越来越多大家倾向于说

从更多的数据里面

去得出一些结论来帮助我做决策

这个现在是值得尝试

也可以去做的

所以在结构思维智能化这里面

我觉得更突出的就是说

我们能不能尽量让人少参与一些

让数据更多地参与一些

比如说这个

因为这个环节

其实有很多挺精彩的东西可以讲

但是这里面

因为一些商业项目的约束

这里面就没办法讲太细

只能讲一些大概的逻辑

像这个是我们给一个

这种大型的仓储式销售的

会员制的一个零售企业去做

他们想选址

因为他们

这是仓储式的嘛

像北京这么大的城市

他们也就开两到三家

像深圳这样的城市就开一家两家

像这样的

所以他就特别慎重

不像说便利蜂这种

我从公司到这两公里

我看见好几家便利蜂

因为它需要很密集地去覆盖

但是这种它不需要

所以它一旦开店

它的成本是很大的

所以就希望说

能不能借助这种数据

更智能地帮我去做一些决策

减少一些风险

他们的诉求就是说

我一旦选这

你能不能给我评估一下

我营业额会怎么样

或者会员数怎么样 对吧

包括像这个

这张图是我们给

也是一个比较大的

一个连锁快餐的零售企业

去做评估

就是评估营业额

它需要去评估每个店的营业额

当然它的好

它这个做的好处在于

你像前面那个我选一个之后

好坏就那样了

我不能把它推翻了再重新来了

那成本太大了

它这好处在于哪呢

它对已经开店的

因为快餐店它很多

对于已经开的这个店去做预测

它每个月都可以做

我这个月预测一下

到月底了我去验证一下

我这模型到底灵不灵

就不灵的话我再修正一下

我接着预测

然后这些预测模型达到一定的

他觉得满意了

我就可以拿它来去做选址

所以这个

所以不同的场景

玩法也不一样

所以这里面过多细节不说

就说一个大概思路

就是我们怎么去在一个

像前面说的

一个大型的零售的这种

一个城市开一两家 两三家这种

怎么去

大概一个思路

这里面有一个约束

就是我们希望说

用智能化的方法去做分析

但智能化方法大家都知道

智能化的方法

有一个先天条件

就是我必然需要大量的数据

你一个城市就两家店

全国就几十个城市

有总共不到一百家店

怎么做预测呢

一百家店的数据去告诉我

一个北京这么大城市

你开在东边还是西边

这不现实

那怎么来解决这个问题呢

其实这是一个什么

是训练数据量不足的一个问题

那怎么来解决呢

刚好我们因为之前做了

这个自然街区的数据

我们就换了一个思路

你不是店面不够吗

但是你会员够多

因为它是会员制的

就是你在它家消费

你必须要注册会员

但它一个城市的会员数量是有的

那我们做了一个

我觉得这个我们同事还很

我觉得这方面做得很聪明

他把会员的数据

放到这些自然街区里边去

比如说 Sorry

比如说像这张图

假设说这个店在这的话

那它的其他的会员分布

肯定是围绕离它更近的

会员越多的

当然也会覆盖到整个城市

它把它的会员按照它的住址

会分到这些自然街区里边去

那一下子一个城市里边的这些

样本量就多了

而且我样本量里边

还会有其他的一些数据

比如说商场的数量

宠物店的数量

因为它面向的消费的人群

相对高端一点

像宠物店这种 洗衣店这种

相关性会比较高

那这些数据再进去的话

样本量一下就多了

那这样的话

我们可以把全国

它所有店的这些会员

都分到这个街区里边去

那这样的话

我们把训练样本

从它的店面变成了啥

变成自然街区

然后把这个到店的距离

也作为一个因素考虑在里面

这样的话 全国就有

应该有几万的街区可以用了

这里面也做了一个尝试

就是尽量少地让人说

我去问用户说

你觉得哪些因素

和你的用户特征是比较匹配的

其实他也说不出来

所以这里面我们也做了一些

用POI的数据 用人的数据

去做了一些

做一个初步的分析

比如说我们分析出来

可能有100种或者80种

是比较相关的

那有一个初步之后

再用人在这里面去

经验再发挥点作用

顾虑到那些怎么想都不太可能的

不太靠谱地去掉一些

这样的话 特征的量也会上来

因为靠经验在里面

这个量不会太多

所以这种特征工程的话

就是说我们把每个街区里边

我们觉得哪些特征

跟它的用户是相关的

得把这些特征提取出来

那这样的话

每一个街区就变成了一个

带有这种特征指标的

一些训练样本

那我们把这些

再拿一些模型去做训练

那这里面举个例子

比如说随机森林

去做训练

训练完了之后

把我们得出来的这个模型

再去做预测的话

我们能得到一个什么样的结果呢

就是我在城市的任何一个地方

假设说你想在这个地方开店

我能预测一下在这个城市里面

在每个街区里面会有多少会员

那这样的话

通过会员数来间接地去推算

可能的营业额

那这个其实整个思路就通了

当然这里面

不会像我说的这么简单

几句话把这个过程就说清楚了

中间要进行大量的

这种模型的实验

然后参数的调试等等的

包括用什么样的数据去参与计算

所以挺复杂的一个过程

但最终我们得到一个结果

是这样的

我们交付的结果就是

你在城市里面点任何一个点

我告诉你

你的会员分布是

大概是一个什么样子的

总结一下

其实今天说了很多

一些场景化的

一些故事 一些案例

其实还是想强调说

大家后面如果以后工作中

或者学习中

遇到一些要解决的问题

可以考虑一下

我通过地理维度

能不能帮我更快地来解决问题

更好地解决问题

那这里第一个来说的话

首先你得考虑有没有数据

没数据那这些都没用

然后最后我们把我们一般做

针对一个特定的需求

怎么去做分析

一个套路给大家讲了一下

就是隐性思维显性化

其实就是怎么用可视化

去解决一般性的问题

或者做一些初步的数据探索

再一个就是结构化

我们用这种指标化的

然后把这种领域知识

专家系统的经验放到里面

做一些定性 定量的评估

那第三步就是说

我们希望更智能地

去做决策的时候

我们希望能从数据里面

挖掘更多的信息出来

那我们就需要更多的这种

多维的数据

包括就用一些

目前比较流行的模型

然后去达到这种辅助决策的作用

Ok 今天内容就这些

好 谢谢大家

新城市科学课程列表:

1. 新城市科学概论(1)

-1.1 城市及城市科学的发展演变

--课程视频

-1.2 新城市科学的提出

--课程视频

-1.3 相关研究机构 、期刊和课程

--课程视频

-1.4 变化中的城市

--课程视频

-课程讲义

-课后讨论

-课后练习1

2. 新城市科学概论(2)

-2.1 城市概念的定义

--课程视频

-2.2 城市正在发生的变化:驱动力

--课程视频

-2.3 城市正在发生的变化:产品/服务

--课程视频

-2.4 城市正在发生的变化:城市空间

--课程视频

-课程讲义

-课外阅读

-课后讨论

-课后练习2

3. 地理数据分析、可视化与商业智能

-3.1 为什么强调地理思维

--课程视频

-3.2 地理思维应用的基础

--课程视频

-3.3 如何应用地理思维

--课程视频

-3.4 课堂提问

--课程视频

-课程讲义

-课外阅读

-课后讨论

-课后练习3

4. 新城市科学支持下的社区善治

-4.1 我所理解的新城市科学

--课程视频

-4.2 新城市科学的机遇

--课程视频

-4.3 新城市科学下的规划治理

--课程视频

-4.4 新城市科学下的社区实践

--课程视频

-课程讲义

-课外阅读

-课后讨论

-课后练习4

5. 数字孪生城市:虚实相生的未来

-5.1 从数字孪生到数字孪生城市

--课程视频

-5.2 数字孪生城市的系统认知

--课程视频

-5.3 数字孪生城市的实践突破

--课程视频

-课程讲义

-课外阅读

-课后讨论

-课后练习5

6. 机器学习、人工智能与深度学习

-6.1 前言

--课程视频

-6.2 机器学习

--课程视频

-6.3 深度学习

--课程视频

-6.4 城市科学当中的应用

--课程视频

-6.5 课堂提问

--课程视频

-课程讲义

-课外阅读

-课后讨论

-课后练习6

7. 物联网与穿戴式设备

-7.1 前言

--课程视频

-7.2 物联网(1)

--课程视频

-7.3 物联网(2)

--课程视频

-7.4 基于物联网的相关案例

--课程视频

-7.5 基于穿戴式设备的相关案例

--课程视频

-课程讲义

-课外阅读

-课后讨论

-课后练习7

8. 从城市数据到智慧城市

-8.1 前言

--课程视频

-8.2 智慧城市:ICT技术驱动的空间变革

--课程视频

-8.3 智慧城市:从大脑到神经系统的改造之路

--课程视频

-8.4 城市数据:从问题洞察到管理与运营工具

--课程视频

-8.5 课堂提问

--课程视频

-课程讲义

-课外阅读

-课后讨论

-课后练习8

9. 让智慧城市成为触得到的幸福:美团智慧城市的探索与实践

-9.1 数据介绍

--课程视频

-9.2 商圈识别、分类与评价

--课程视频

-9.3 项目介绍与产品升级

--课程视频

-9.4 课堂提问

--课程视频

-课程讲义

-课外阅读

-课后讨论

-课后练习9

10. 人本尺度城市形态:定义、理论与方法

-10.1 人本尺度城市形态:定义

--课程视频

-10.2 人本尺度城市形态:理论

--课程视频

-10.3 人本尺度城市形态:方法

--课程视频

-课程讲义

-课外阅读

-课后讨论

-课后练习10

11. 计算社会科学新进展

-11.1 大数据+城市科学

--课程视频

-11.2 计算社会科学:方法论

--课程视频

-11.3 计算社会科学:方法与议题

--课程视频

-11.4 计算社会科学:前沿应用

--课程视频

-课程讲义

-课后讨论

-课外阅读

-课后练习11

12. 数据增强设计与未来城市空间

-12.1 未来城市:空间干预与数字创新

--课程视频

-12.2 未来城市:认识论和方法论

--课程视频

-12.3 案例分享

--课程视频

-课程讲义

-课后讨论

-课外阅读

-课后练习12

13. 课程研讨

-课程视频

-课后讨论

课程视频笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。