当前课程知识点:微软亚洲研究院大数据系列讲座 >  第四讲:城市计算中的大数据研究(上)(郑宇) >  城市规划(urban planning) >  城市规划(urban planning)

返回《微软亚洲研究院大数据系列讲座》慕课在线视频课程列表

城市规划(urban planning)在线视频

城市规划(urban planning)

下一节:识别特定区域(indentify functional regions)

返回《微软亚洲研究院大数据系列讲座》慕课在线视频列表

城市规划(urban planning)课程教案、知识点、字幕

大家好!我是微软研究院的郑宇。

这次课我会介绍大数据

能够怎样帮助改进城市规划。

这里有两个例子。

第一个例子是利用

大量出租车的GPS轨迹来收集

城市交通网络中有问题的设计。

在第二个例子中,

我们想要通过融合兴趣点数据和

人的移动性数据来识别城市中的功能区域,

如教育区域、商业区域。

在这个项目中,我们的目标是使用

车辆的GPS轨迹、路网数据等交通数据

来收集城市道路网络中有问题的设计。

一些路网设计在很多年前也许是合适的,

但是随着交通流量的增长,

这些路网设计可能会过时或者不那么合适了。

所以,我们是否能基于数据自动识别这类设计,

然后把这些有问题的设计告诉城市规划者,以便他们能够

在未来的设计中对其进行改进。

这就是这个项目的核心。

所以,目标是对整个城市的交通状况进行建模,

并且基于数据收集城市路网中

有问题的设计。这里我们使用

北京连续三年的GPS轨迹数据。

其中每年的数据都包含30000辆出租车的轨迹。

这个研究在Ubicomp 2011上报告过。

你们可以去看那篇论文以获得更多相关的信息。

我们的方法首先使用主要道路,

如环路、高速公路和主干道,对城市进行划分。

然后,城市被分成不相交的

相邻区域或者以主要道路为界的区域。

这里,每个区域都携带了一些语义信息,

如相邻区域或者一些社区。人们生活在区域中

并往返于区域之间。因此,区域

是交通问题的源头或者根源,

而路面上的交通拥堵

只是表层的现象。

因此,我们着重研究在交通流量方面

没有很好地相连的区域对。

进一步来说,在数据驱动的方法中,

我们把一天的时间分成一组时间间隔。

例如,在左边这幅图中,黑色的曲线表示

一天中不同时间整个城市中

车辆的平均行驶速度,红色的线

表示一整天中整个城市中的

车辆的平均行驶速度。你们可以看到,

黑色的曲线被分成了

四个时间间隔。也就是这一个、这一个、这一个和

这一个。用这种方式,我们可以基于

所观察到的交通数据把一天分成四个时间段。

同样的,我们可以把周末的一天

分成三个时间段,就像这个。

然后,我们可以把每个时间段中

车辆的GPS轨迹投射到刚才划分的区域中去。

然后,我们就可以做出

一张区域图。其中,每个节点表示一个区域,

两个节点之间的条边

表示往返于这两个区域之间

以及驶过这两个区域的车辆的集合。

对于每条边,我们可以抽取三个特征。

第一个特征是驶过

这两个区域的车辆的数量。这里我们使用出租车的数量作为指标,

因为我们使用出租车产生的数据。

这里使用的方法是通用的。

这意味着可以使用不同的数据集,

只要这些数据集能够表示城市中的交通状况。

第二个特征是两个区域之间

所有车辆的期望行驶速度。

假设有三辆车驶过了两个区域,

那么我们就可以计算这三辆车的真实行驶速度的平均值。

第三个特征是两个区域之间的真实行驶距离与

两个区域中心点之间的欧式距离之比。这意味着这个部分。

这个比值越大,

人们在两个区域之间移动时就需要绕更远的路。

我们可以将区域图中的一条边

表示为三维空间中的一个点。

其中,第一个维度表示交通流量,第二个维度表示

平均行驶速度,第三个维度表示比例比例。

这里我们想要识别一些点,

与这些点相连的边表示的交通流量很大。

这是很大的S,很低的速度,以及大的比例,我是指大弯路。

这意味着人们绕了一个很大的弯,而且交通流量

非常大,行驶速度非常慢。

这类区域被认为是没有很好地被连接的区域。

但是,怎么样来定义“大”呢?

交通流量应该是多大呢?

我们没有任何阈值,要为每个特征

都定义这样一个阈值也非易事。

这里我们利用

在数据库领域广泛使用的Skyline操作符技术。

一个简单的方法是,首先选择

交通流量高于平均值的边。

然后,我们只关注二维空间。

也就是说,我们想要识别行驶速度很低

和比例很大的边,这意味着是很大的弯。

这里在这个skyline上的点,也就是这条蓝色的线,我们称之为skyline。

因为我们在数据集中

无法找到其他点,能够同时满足

比skyline上其他任何点都有

更小的E(V)和更大的θ。

这意味着,其他点,

被skyline点所支配的圆点。

这意味着,我们找不到比这些边

的行驶速度更低且弯比例更大的边。

我们可以看到,

Skyline上的边可能是有问题的设计。

当然,我们不能仅仅

基于一个实例来做判断,所以我们需要检查多天的情况。

这就是我们的方法。

我们检测skyline点,

也就是每天的每个时间段的skyline边,

然后我们就可以把

一些图连接成更大的图。例如,

把r1、r2和r2、r8连接成更大的r1、

r2和r8,因为它们在时间上是

相邻的而且在空间上与r2有重叠。

但是,对于第一个时间段中的r1和

第三个时间段中的r3,我们不能把它们连接在一起,

因为它们在时间上是不相邻的。使用这种方法,

我们就可以做出每天的skyline图。

然后,我们把多天的

Skyline图的模式结合起来,以避免错误的警告。

错误的警告是指,

如果只关注一天的数据,那么有可能是

因为交通事故引起的;但是如果一个问题

在多天中频繁出现,那么就必然是

由设计的问题引起的。

这里是一个例子。我们发现r1、r2、r8和r4

每三天出现一次。所以,这有可能是一个问题。

这类子图为我们提供了

更多关于单条边的信息。

我们可以知道问题是怎么发生的

以及问题之间是怎么相互影响的。

这里是结果。

我们从2009年、2010年和2011年的数据中检测到,

颜色越深的区域

发生问题的次数就越多,因为问题

是使用一些区域对或者区域图表示的。

让我们来看一些例子。

在第一个例子中,我们

发现北京的望京区域存在一个问题。

但是,这个问题在2010年消失了。这是为什么呢?

问题是这样的。因为很多人

想要穿过两个区域进入北京的四环路。

所以出现了问题。

但是,后来这里有一条路扩建了。

给人们提供了进入四环路的另一个选择。

后来,我们发现这个问题消失了。

在这个例子中,我们看到,这条路的扩建

对于解决望京地区的交通拥堵发挥了作用。

换句话说,

我可以说,从一年中产生的数据,

我们可以发现城市中的问题;

通过对比从连续两年的数据

得到的结果,我们可以检验

我们所做的城市规划

是否发挥了作用。这意味着我们可以对城市规划进行评价,

例如,当新建了一条路或者一个地铁站时,评估这一基础设施

是否真的能够帮助我们的城市

变得更好。

这就是我们的研究工作的两项贡献。

第一年的时候我们发现了问题,通过对比

连续两年的结果,我们可以

对新建的基础设施或者城市规划进行评价。

在第二个例子中,我们在2009年没有发现问题,

但是在2010年出现了问题,

在2011年这个问题又消失了。

这令人感到奇怪,因为

在2010年出现了问题并不令人觉得奇怪。

我们检查了

望京地区的交通密度,发现这个区域

的颜色变得越来越深,这意味着越来越多的人到望京区域去。

所以这里发生了问题,这是合理的。

但是,为什么望京地区的交通流量增长了,

而这里的问题却消失了呢?让我们来看看。

原因是,在2011年

望京地区新建了一条地铁。

所以,人们多了一种选择,

可以乘坐地铁进入望京地区。

然后问题就消失了。在这个例子中,我们可以看到,地铁线路

在某种程度上解决了望京地区的交通问题。

我们还发现了一些不但没有解决,

反而变得更加严重了的问题。

这个地方是

一个近年来越来越

受欢迎的购物中心,但是这个区域周边的

道路设施并没有改善。

所以你们看到,问题变得越来越严重了。

你们可以看到,颜色变得越来越深了。

我们可以对城市规划者提出有关这类问题的建议,

以便他们能够在未来解决这些问题。

这项研究发表在Ubicomp 2011上,

后来被MIT技术评论

评为使用大数据解决城市中的挑战,

特别是城市规划中的挑战的开创性工作。

谢谢大家。如果你们对城市计算感兴趣的话,

请继续参加我们的课程或者

阅读下面这张幻灯片中展示的综述论文。

谢谢大家!

微软亚洲研究院大数据系列讲座课程列表:

第一讲:大数据研究现状及未来趋势(洪小文)

-什么是大数据(What is big data?)

--什么是大数据(What is big data?)

-为什么大数据是当前热点(Why big data is a nature phenomenon?)

--为什么大数据是当前热点(Why big data is a nature phenomenon?)

-新的计算基础设施和工具(New Infrastructure and tools)

--新的计算基础设施和工具(New Infrastructure and tools)

-课程简介(Course Introduction)

--课程简介(Course Introduction)

-基础设施,机器学习和可视化(Infrastructure,Machine Learning and Visualization)

--基础设施,机器学习和可视化(Infrastructure,Machine Learning and Visualization)

-大数据与传统商业智能的区别(Big data:different from traditional BI)

--大数据与传统商业智能的区别(Big data:different from traditional BI)

-Quiz

--Quiz--作业

第二讲:互联网搜索中的大数据研究(宋睿华)

-大规模超文本网络搜索引擎的解析(the anatomy of a large scale hypertextual web search engine)

--大规模超文本网络搜索引擎的解析(the anatomy of a large scale hypertextual web search engine)

-搜索引擎如何实现每秒数千次的查询(How does a web search engine process thousands of queries per second?)

--搜索引擎如何实现每秒数千次的查询(How does a web search engine process thousands of queries per second?)

-探寻搜索的多个维度(finding dimensions for queries)

--探寻搜索的多个维度(finding dimensions for queries)

-Quiz

--Quiz--作业

第三讲:社会计算中的大数据研究(谢幸)

-背景介绍(background)

--背景介绍(background)

-用户移动规律的理解-1(user mobility understanding-1)

--用户移动规律的理解-1(user mobility understanding-1)

-用户移动规律的理解-2(user mobility understanding-2)

--用户移动规律的理解-2(user mobility understanding-2)

-用户画像与个人隐私-1(user profiling and privacy-1)

--用户画像与个人隐私-1(user profiling and privacy-1)

-用户画像与个人隐私-2(user profiling and privacy-2)

--用户画像与个人隐私-2(user profiling and privacy-2)

-Quiz

--Quiz--作业

第四讲:城市计算中的大数据研究(上)(郑宇)

-城市计算中的大数据研究简介(introduction to urban big data)

--城市计算中的大数据研究简介(introduction to urban big data)

-概念,框架和挑战(concepts,framework and chanlleges)

--概念,框架和挑战(concepts,framework and chanlleges)

-基础技术(fundamental techniques)

--基础技术(fundamental techniques)

-城市规划(urban planning)

--城市规划(urban planning)

第四讲:城市计算中的大数据研究(下)(郑宇)

-识别特定区域(indentify functional regions)

--识别特定区域(indentify functional regions)

-城市空气质量与大数据研究(urban air quality meets big data)

--城市空气质量与大数据研究(urban air quality meets big data)

-能源交通和环境污染(traffic energy and pollution)

--能源交通和环境污染(traffic energy and pollution)

-大数据在城市噪音处理中的应用(diagnose urban noise with big data)

--大数据在城市噪音处理中的应用(diagnose urban noise with big data)

-Quiz

--Quiz--作业

第五讲:软件分析中的大数据研究(张洪宇)

-软件分析的概念(the concepts of software analytics)

--软件分析的概念(the concepts of software analytics)

-软件分析的实例(examples of software analytics)

--软件分析的实例(examples of software analytics)

第六讲:大数据分析可视化研究(刘世霞)

-传统的数据可视化(Traditional information visualization)

--传统的数据可视化(traditional information visualization)

-同质数据的可视化分析-1(Visual Analytics of Homogeneous Data-1)

--同质数据的可视化分析-1(Visual Analytics of Homogeneous Data-1)

-同质数据的可视化分析-2(Visual Analytics of Homogeneous Data-2)

--同质数据的可视化分析-2(Visual Analytics of Homogeneous Data-2)

-异质数据的可视化分析(Visual Analytics of Heterogeneous Data)

--异质数据的可视化分析(Visual Analytics of Heterogeneous Data)

-Quiz

--Quiz--作业

城市规划(urban planning)笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。