当前课程知识点:网络、群体与市场 >  第二部分 博弈论 >  第5讲:博弈论简介(2):纳什均衡 >  Video

返回《网络、群体与市场》慕课在线视频课程列表

Video在线视频

Video

下一节:纳什均衡

返回《网络、群体与市场》慕课在线视频列表

Video课程教案、知识点、字幕

各位同学 大家好

欢迎来到网络 群体与市场

的在线课堂

我是这门课的主讲老师——石兵

来自武汉理工大学

在上一讲

我们介绍了博弈论的一些基本概念

比如最佳应对 占优策略等等

我们在这一讲中将介绍

博弈论中最重要的一个概念

叫做纳什均衡

首先我们看一个例子

这个例子我们会看到

它不包含占优策略

这是一个三客户博弈的例子

我们假设有两家公司

这两家都希望和

A B C三个客户来谈生意

每个公司因此有三个可能的策略

也就是说

找客户A或者B或者C

他们在决策的时候考量如下

如果两家公司找同一个客户

则这个客户给

每一个公司一半的业务

由于公司1的规模比较小

所以它不能靠自身找到客户源

所以只要它和公司2

分别寻找不同的客户谈生意

则公司1它就得不到任何收益

因为他做不到任何生意

公司2稍微大一点

所以它可以单独地寻找

B或C来谈生意

它可以得到B或C的全部业务

但是A是一个很大的客户

所以如果想跟客户A谈生意

公司2必须要跟公司1合作

才能谈下来

因为A是一个大客户

所以我们假设跟它做生意的时候

收益是8

因此如果两家公司合作

跟A谈成了生意

则这两家公司的收益分别是4

但是和B或C做生意

的收益则分别是2

如果合作的话每个公司

他们的收益是1 基于此

我们可以用一个收益矩阵

把刚才这样一个问题描述清楚

我们可以看到

这里面参与人是公司1和公司2

他们的策略是选择

与A或B或C来做生意

那么这时候公司1和公司2

他们具体该选择什么样的

一个策略呢

我们首先来看一下他们

有没有严格占优策略

首先我们看

当公司2选择策略A的时候

公司1的最佳应对是什么呢

是选择A 因为4大于0

当公司2选择策略B的时候

公司1的最佳应对是什么呢

我们可以发现

它也是选择B

1大于上面那个和下面那个

那么公司2选择策略C的时候

我们同样可以看到

公司1的最好的策略也是C

通过这个我们可以发现

当公司2的策略变化的时候

公司1的最佳应对策略也发生了变化

因此公司1不存在占优策略

那么公司2是否存在呢

我们也可以分析发现也不存在

比如说

当公司1选择A的时候

公司2的最优策略是也选择A

由于4大于这个2

也大于2 公司1选择B的时候

我们会发现公司2的

最优策略是选择C

这是由于在选择C的时候

它的收益是2

而选择A或者B的时候

它的收益分别是0或者1

同样地我们会发现

公司1选择C的时候

公司2的最好的策略是B

也就是说当公司1的策略变化的时候

公司2的最佳应对策略也发生了变化

因此公司2也不存在占优策略

也就是说两家公司

都没有严格占优策略

那这时候我们该怎么办呢

这个就引入了一个新的解概念

就叫做纳什均衡

那么什么是纳什均衡呢

我们假定参与人甲选择策略S

参与人乙选择策略T

如果S是T的最佳应对

且T也是S的最佳应对

我们就称策略组(S,T)

是一个纳什均衡

其实根据这个定义

我们可以发现纳什均衡它就是

一个互为最佳应对的策略组

在这个互为最佳应对的策略组下

任何博弈的参与人

他单方面改变自己的策略

他不会得到更好的收益

我们刚才已经定义了纳什均衡

我们现在看刚才那一个

三客户博弈里面

在没有占优策略存在的情况下

我们怎么来分析

我们会发现它会存在纳什均衡策略

这个纳什均衡策略说什么呢

就是公司1选择A

公司2也选择A

我们可以看一下它是不是

互为最佳应对的策略组

我们看

当公司1选择A的时候

公司2的最佳策略是它选择A

收益是4

选择B收益是2 选择C收益是2

显然公司2的最佳应对是A

那我们接着看

当公司2选择A的时候

公司1的最佳应对是什么呢

我们同样发现也是A

这是由于我们看到

它选择A的时候

它的收益是4

而选择B和C收益都是0

所以我们可以看到

(A,A)这就是一个

互为最佳应对的策略组

也就是纳什均衡

那么我们怎么来对一个博弈问题

找他的纳什均衡解呢

一般来说有这样两种途径

一个是检查每个策略组

看他们中的每一项是否是

彼此间策略的最佳应对策略

另外一个就是什么呢

另外一个方法就是找出

每一个参与人对于对方

每一个策略的最佳应对

然后再发现互为最佳应对的策略组

我们刚才已经介绍了

纳什均衡的一些基本概念

以及通过一个例子介绍了

怎么寻找纳什均衡

我们可以通过一些更多的例子

来强化这样一个概念

我们看一个协调博弈的例子

我们现在假设你和你的拍档

要为一个项目要准备一份报告

但是在这之前

你们不能通过电话等方式

来商量选择什么样的软件

来做这个报告

这时候你必须决定是用微软的PPT

还是使用苹果的keynote

来制作你负责那半分幻灯片

如果你们使用同样的软件来设计

那最终你们很容易

把你们的报告合并在一起

基于此我们可以得到

这样一个收益矩阵

在这样一个收益矩阵里面有博弈的

参与人 你和你的拍档

然后也有策略

策略就是你是选择PPT

还是选择keynote

在这里面单元格中的数字

表达了你的收益

我们可以看到

当你们选择同样的软件的时候

你们的收益就分别都是1 1

但是如果一方选择PPT

另外一方选择keynote

你们的收益都是0

这是由于你们合并的时候会很困难

通过对这个收益矩阵进行分析

我们可以发现它会存在两个纳什均衡

一个纳什均衡就是

双方都采用PPT

另外一个就是

双方都采用keynote

我们以双方都采用PPT

来分析一下看他们是不是

互为最佳应对的策略组

我们看当你的拍档使用PPT的时候

对于你来说 你可以选择PPT

选择PPT的收益是1

或者选择keynote

你的收益是0 这种情况下

你的最佳应对就是PPT 同样地

对于当你选择PPT的时候

对于你的拍档他也可以选择

PPT或者选择keynote

对应的收益分别是1和0

显然他也应该选择PPT

所以通过这个分析我们可以发现

(PPT,PPT)

这样一个策略组是互为最佳应对的

因此它是一个纳什均衡

另外一点我们需要注意的是

在这样一个博弈问题里面

它存在了两个纳什均衡解

那么在实际的生活中

最终这样博弈的参与人

他们会选择哪一个纳什均衡

作为自己的策略呢

对于这个特殊的例子来说

这个博弈结构本身已经

无法帮你来预测了

我们需要更多地考虑一些外部因素

比如说社会习俗

比如说大家现在都很喜欢苹果的软件

所以我们可能预测最终可以

大家都会所以keynote

刚才这样一个协调博弈

我们还会存在另外一个变种

我们假设你和你的项目拍档

都更喜欢使用苹果软件

在这样一个收益矩阵里面

我们可以发现

当你和你的拍档都使用

keynote的时候

你们的收益是2,2

而如果都是使用PPT的话

收益都是1,1

当然如果你们使用不同的软件

你们的收益都是0

在这里面我们可以同样发现

存在两个纳什均衡

都使用PPT或者

都使用keynote

但是谢林的这样一个聚点理论表明

在实际的场景中我们可以预测

参与人会更加倾向于收益情况

比较好的均衡

也就是说大家会更大的可能性

使用 keynote

这样一个纳什均衡策略

我们再看一个例子

这是一个猎鹿博弈的例子

现在假设有两个猎人他们要外出打猎

如果他们合作的话

他们可以打到鹿

这个可以给双方带来最高的收益

猎人也可以分开单干

这时候他们只能打到兔子

如果一方想去猎鹿

则他的收益是0

但是另外一方依然可以猎到兔子

基于这样一个问题的描述

我们可以得到这样一个收益的矩阵

对这个收益矩阵分析

我们可以发现

这里面的纳什均衡就是

双方都猎鹿或者双方都猎兔

也就是说这样一个问题

存在两个纳什均衡解

但是选择何种均衡呢

这个会存在这样一个风险

可能有些人会倾向于选择猎鹿

或者另外一方会倾向于猎兔

这时候你要在高收益和

由于另外一方不合作

造成损失之间来进行一个权衡

在这一讲我们介绍了纳什均衡

我们现在可以对这样一个博弈的

问题再进一步地进行总结

如果一个博弈问题

双方都有严格占优策略

则很显然大家都会

采用这样一个策略

如果只有一方有严格占优策略

则我们可以预测另外一方会采用

这个严格占优策略的最佳应对

第三个

如果不存在严格占优策略

则这时候我们就要寻找

在这样一个博弈问题里面是

不是有纳什均衡解

本讲主要是针对博弈论

里面的纳什均衡这个概念

进行介绍 谢谢

网络、群体与市场课程列表:

第一部分 图论与社会网络

-第1讲:社会网络的结构与关系强度

--Video

--三元闭包

-第2讲:同质性

--Video

--同质性

-第3讲:社会网络中的正负关系及平衡

--Video

第二部分 博弈论

-第4讲:博弈论简介(1):占优策略

--Video

--严格占优策略

-第5讲:博弈论简介(2):纳什均衡

--Video

--纳什均衡

-第6讲:博弈论简介(3):混合策略纳什策略

--Video

-第7讲:进化博弈论(1):进化稳定策略

--Video

-第8讲:进化博弈论(2):进化稳定策略与纳什均衡的关系

--Video

-第9讲:博弈论应用:交通网络流分析

--Video

-第10讲:博弈论应用:拍卖分析

--Video

-第二部分 博弈论--习题

第三部分 网络中的市场与策略性互动

-第11讲:匹配市场

--Video

--二部图匹配

-第12讲:中间商市场

--Video

--中间商市场定价的影响

-第13讲:社交关系价值的均衡

--Video

第四部分 信息网络与万维网

-第14讲:万维网的结构

--Video

-第15讲:网络信息的链接分析

--Video

-第16讲:搜索引擎中的广告市场:匹配市场机制

--Video

--广告市场的相关建议

-第17讲:搜索引擎中的广告市场:GSP和VCG机制

--Video

--拍卖理论的实际应用

-第四部分 信息网络与万维网--习题

第五部分 网络动力学:总体模型

-第18讲:信息级联

--Video

--信息级联

-第19讲:网络效应

--Video

--网络效应

第六部分 网络动力学:结构模型

-第20讲:网络中的级联行为

--Video

--网络级联

-第21讲:小世界现象

--Video

--网络效应

-第六部分 网络动力学:结构模型--习题

第七部分 机构及其聚合行为

-第22讲:市场与信息(1):外生事件

--Video

-第23讲:市场与信息(2):内生事件

--Video

--市场与信息

-第24讲:表决

--Video

--表决

-第七部分 机构及其聚合行为--习题

Video笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。