当前课程知识点:网络、群体与市场 > 第二部分 博弈论 > 第5讲:博弈论简介(2):纳什均衡 > Video
各位同学 大家好
欢迎来到网络 群体与市场
的在线课堂
我是这门课的主讲老师——石兵
来自武汉理工大学
在上一讲
我们介绍了博弈论的一些基本概念
比如最佳应对 占优策略等等
我们在这一讲中将介绍
博弈论中最重要的一个概念
叫做纳什均衡
首先我们看一个例子
这个例子我们会看到
它不包含占优策略
这是一个三客户博弈的例子
我们假设有两家公司
这两家都希望和
A B C三个客户来谈生意
每个公司因此有三个可能的策略
也就是说
找客户A或者B或者C
他们在决策的时候考量如下
如果两家公司找同一个客户
则这个客户给
每一个公司一半的业务
由于公司1的规模比较小
所以它不能靠自身找到客户源
所以只要它和公司2
分别寻找不同的客户谈生意
则公司1它就得不到任何收益
因为他做不到任何生意
公司2稍微大一点
所以它可以单独地寻找
B或C来谈生意
它可以得到B或C的全部业务
但是A是一个很大的客户
所以如果想跟客户A谈生意
公司2必须要跟公司1合作
才能谈下来
因为A是一个大客户
所以我们假设跟它做生意的时候
收益是8
因此如果两家公司合作
跟A谈成了生意
则这两家公司的收益分别是4
但是和B或C做生意
的收益则分别是2
如果合作的话每个公司
他们的收益是1 基于此
我们可以用一个收益矩阵
把刚才这样一个问题描述清楚
我们可以看到
这里面参与人是公司1和公司2
他们的策略是选择
与A或B或C来做生意
那么这时候公司1和公司2
他们具体该选择什么样的
一个策略呢
我们首先来看一下他们
有没有严格占优策略
首先我们看
当公司2选择策略A的时候
公司1的最佳应对是什么呢
是选择A 因为4大于0
当公司2选择策略B的时候
公司1的最佳应对是什么呢
我们可以发现
它也是选择B
1大于上面那个和下面那个
那么公司2选择策略C的时候
我们同样可以看到
公司1的最好的策略也是C
通过这个我们可以发现
当公司2的策略变化的时候
公司1的最佳应对策略也发生了变化
因此公司1不存在占优策略
那么公司2是否存在呢
我们也可以分析发现也不存在
比如说
当公司1选择A的时候
公司2的最优策略是也选择A
由于4大于这个2
也大于2 公司1选择B的时候
我们会发现公司2的
最优策略是选择C
这是由于在选择C的时候
它的收益是2
而选择A或者B的时候
它的收益分别是0或者1
同样地我们会发现
公司1选择C的时候
公司2的最好的策略是B
也就是说当公司1的策略变化的时候
公司2的最佳应对策略也发生了变化
因此公司2也不存在占优策略
也就是说两家公司
都没有严格占优策略
那这时候我们该怎么办呢
这个就引入了一个新的解概念
就叫做纳什均衡
那么什么是纳什均衡呢
我们假定参与人甲选择策略S
参与人乙选择策略T
如果S是T的最佳应对
且T也是S的最佳应对
我们就称策略组(S,T)
是一个纳什均衡
其实根据这个定义
我们可以发现纳什均衡它就是
一个互为最佳应对的策略组
在这个互为最佳应对的策略组下
任何博弈的参与人
他单方面改变自己的策略
他不会得到更好的收益
我们刚才已经定义了纳什均衡
我们现在看刚才那一个
三客户博弈里面
在没有占优策略存在的情况下
我们怎么来分析
我们会发现它会存在纳什均衡策略
这个纳什均衡策略说什么呢
就是公司1选择A
公司2也选择A
我们可以看一下它是不是
互为最佳应对的策略组
我们看
当公司1选择A的时候
公司2的最佳策略是它选择A
收益是4
选择B收益是2 选择C收益是2
显然公司2的最佳应对是A
那我们接着看
当公司2选择A的时候
公司1的最佳应对是什么呢
我们同样发现也是A
这是由于我们看到
它选择A的时候
它的收益是4
而选择B和C收益都是0
所以我们可以看到
(A,A)这就是一个
互为最佳应对的策略组
也就是纳什均衡
那么我们怎么来对一个博弈问题
找他的纳什均衡解呢
一般来说有这样两种途径
一个是检查每个策略组
看他们中的每一项是否是
彼此间策略的最佳应对策略
另外一个就是什么呢
另外一个方法就是找出
每一个参与人对于对方
每一个策略的最佳应对
然后再发现互为最佳应对的策略组
我们刚才已经介绍了
纳什均衡的一些基本概念
以及通过一个例子介绍了
怎么寻找纳什均衡
我们可以通过一些更多的例子
来强化这样一个概念
我们看一个协调博弈的例子
我们现在假设你和你的拍档
要为一个项目要准备一份报告
但是在这之前
你们不能通过电话等方式
来商量选择什么样的软件
来做这个报告
这时候你必须决定是用微软的PPT
还是使用苹果的keynote
来制作你负责那半分幻灯片
如果你们使用同样的软件来设计
那最终你们很容易
把你们的报告合并在一起
基于此我们可以得到
这样一个收益矩阵
在这样一个收益矩阵里面有博弈的
参与人 你和你的拍档
然后也有策略
策略就是你是选择PPT
还是选择keynote
在这里面单元格中的数字
表达了你的收益
我们可以看到
当你们选择同样的软件的时候
你们的收益就分别都是1 1
但是如果一方选择PPT
另外一方选择keynote
你们的收益都是0
这是由于你们合并的时候会很困难
通过对这个收益矩阵进行分析
我们可以发现它会存在两个纳什均衡
一个纳什均衡就是
双方都采用PPT
另外一个就是
双方都采用keynote
我们以双方都采用PPT
来分析一下看他们是不是
互为最佳应对的策略组
我们看当你的拍档使用PPT的时候
对于你来说 你可以选择PPT
选择PPT的收益是1
或者选择keynote
你的收益是0 这种情况下
你的最佳应对就是PPT 同样地
对于当你选择PPT的时候
对于你的拍档他也可以选择
PPT或者选择keynote
对应的收益分别是1和0
显然他也应该选择PPT
所以通过这个分析我们可以发现
(PPT,PPT)
这样一个策略组是互为最佳应对的
因此它是一个纳什均衡
另外一点我们需要注意的是
在这样一个博弈问题里面
它存在了两个纳什均衡解
那么在实际的生活中
最终这样博弈的参与人
他们会选择哪一个纳什均衡
作为自己的策略呢
对于这个特殊的例子来说
这个博弈结构本身已经
无法帮你来预测了
我们需要更多地考虑一些外部因素
比如说社会习俗
比如说大家现在都很喜欢苹果的软件
所以我们可能预测最终可以
大家都会所以keynote
刚才这样一个协调博弈
我们还会存在另外一个变种
我们假设你和你的项目拍档
都更喜欢使用苹果软件
在这样一个收益矩阵里面
我们可以发现
当你和你的拍档都使用
keynote的时候
你们的收益是2,2
而如果都是使用PPT的话
收益都是1,1
当然如果你们使用不同的软件
你们的收益都是0
在这里面我们可以同样发现
存在两个纳什均衡
都使用PPT或者
都使用keynote
但是谢林的这样一个聚点理论表明
在实际的场景中我们可以预测
参与人会更加倾向于收益情况
比较好的均衡
也就是说大家会更大的可能性
使用 keynote
这样一个纳什均衡策略
我们再看一个例子
这是一个猎鹿博弈的例子
现在假设有两个猎人他们要外出打猎
如果他们合作的话
他们可以打到鹿
这个可以给双方带来最高的收益
猎人也可以分开单干
这时候他们只能打到兔子
如果一方想去猎鹿
则他的收益是0
但是另外一方依然可以猎到兔子
基于这样一个问题的描述
我们可以得到这样一个收益的矩阵
对这个收益矩阵分析
我们可以发现
这里面的纳什均衡就是
双方都猎鹿或者双方都猎兔
也就是说这样一个问题
存在两个纳什均衡解
但是选择何种均衡呢
这个会存在这样一个风险
可能有些人会倾向于选择猎鹿
或者另外一方会倾向于猎兔
这时候你要在高收益和
由于另外一方不合作
造成损失之间来进行一个权衡
在这一讲我们介绍了纳什均衡
我们现在可以对这样一个博弈的
问题再进一步地进行总结
如果一个博弈问题
双方都有严格占优策略
则很显然大家都会
采用这样一个策略
如果只有一方有严格占优策略
则我们可以预测另外一方会采用
这个严格占优策略的最佳应对
第三个
如果不存在严格占优策略
则这时候我们就要寻找
在这样一个博弈问题里面是
不是有纳什均衡解
本讲主要是针对博弈论
里面的纳什均衡这个概念
进行介绍 谢谢
-第1讲:社会网络的结构与关系强度
--Video
--三元闭包
-第2讲:同质性
--Video
--同质性
-第3讲:社会网络中的正负关系及平衡
--Video
-第4讲:博弈论简介(1):占优策略
--Video
--严格占优策略
-第5讲:博弈论简介(2):纳什均衡
--Video
--纳什均衡
-第6讲:博弈论简介(3):混合策略纳什策略
--Video
-第7讲:进化博弈论(1):进化稳定策略
--Video
-第8讲:进化博弈论(2):进化稳定策略与纳什均衡的关系
--Video
-第9讲:博弈论应用:交通网络流分析
--Video
-第10讲:博弈论应用:拍卖分析
--Video
-第二部分 博弈论--习题
-第11讲:匹配市场
--Video
--二部图匹配
-第12讲:中间商市场
--Video
-第13讲:社交关系价值的均衡
--Video
-第14讲:万维网的结构
--Video
-第15讲:网络信息的链接分析
--Video
-第16讲:搜索引擎中的广告市场:匹配市场机制
--Video
-第17讲:搜索引擎中的广告市场:GSP和VCG机制
--Video
-第四部分 信息网络与万维网--习题
-第18讲:信息级联
--Video
--信息级联
-第19讲:网络效应
--Video
--网络效应
-第20讲:网络中的级联行为
--Video
--网络级联
-第21讲:小世界现象
--Video
--网络效应
-第六部分 网络动力学:结构模型--习题
-第22讲:市场与信息(1):外生事件
--Video
-第23讲:市场与信息(2):内生事件
--Video
--市场与信息
-第24讲:表决
--Video
--表决
-第七部分 机构及其聚合行为--习题




