当前课程知识点:网络、群体与市场 > 第二部分 博弈论 > 第8讲:进化博弈论(2):进化稳定策略与纳什均衡的关系 > Video
各位同学大家好
欢迎来到网络 群体与市场
的在线课堂
我是这门课的主讲老师——石兵
来自武汉理工大学
这一讲我们将继续介绍进化博弈论
我们将重点介绍进化博弈论中
进化稳定策略与纳什均衡的关系
我们回忆一下
在博弈论里面介绍的
双人双策略对称博弈
在这样一个双人双策略对称博弈中
有两个参与者
参与者1和2
他们的策略都是S和T
他们的收益是对称的
对称是指当大家都采用
策略S的时候他们收益都是a
都采用T的时候收益是d
采用策略S T的时候
收益分别是b和c
在这种情况下我们就要来判断
a b c d必须满足什么样的
条件(S S)才是纳什均衡
或者说满足什么样的条件
(S T)是均衡
(T S)是均衡
(T T)是均衡
首先我们来分析当(S S)是
均衡的时候
a b c d必须要
满足什么样的条件
我们可以看到
当(S S)是均衡的时候
按照纳什均衡的定义
(S S)必须
是互为应对最佳的策略组
在这种情况下
当参与人2选择策略S的时候
参与人1的最佳应对必须也是S
这时候有什么呢
我们必须要有a要大于等于c
同样的
当参与人1选择S的时候
参与人2的最佳应对也是S
这时候必须要有采取S的得到的
收益a要大于
采取T得到的收益c
因此我们可以说
如果(S S)是纳什均衡
则a必须要大于等于c
同样的我们还可以分析
比如说当(T S)是均衡的时候
要满足什么条件
我们可以看到
当(T S)是均衡的时候
说明什么 说明(T S)是
一个互为最佳应对的策略组
也就是当参与人2
选择策略S的时候
参与人1发现他采取T
是他的最佳应对
所以必须要有c要大于等于a
当参与人1选择策略T的时候
参与人2的最佳应对必须是S
这时候有什么呢
必须要有b要大于等于d
也就是说
我们可以根据不同的纳什均衡
我们可以判断出
a b c d
必须满足什么样的一个条件
我们现在再回头看进化稳定策略
这个a b c d要
满足什么样的条件呢
我们首先看对于一个很小的正数x
当T入侵S
也就是说在总体中有
1-x部分会使用策略S
有x部分会使用策略T
我们这时候要判断
当S是进化稳定的时候
a b c d必须要满足
什么样的条件
这时候我们可以计算出采取
S策略的期望收益等于多少
我们可以算出在采取S策略的时候
它的期望收益应该等于
a*(1-x)+b*x
而采取T的期望收益等于多少呢
等于c*(1-x)+d*x
如果说S是一个进化稳定策略
我们必须要有什么
我们必须要有采取S策略的
期望收益要大于采取T策略的
期望收益
也就是要满足这样一个不等式
由于x是很小的
所以我们可以看到
当a大于c的时候
这个不等式肯定是成立的
另外一种情况是什么呢
a等于c
这时我们必须要有什么
要有b大于d
也就是说我们可以判断出
在a大于c或者a等于c
且b大于d的时候
S是一个进化稳定策略
也就是说我们可以看到
在双人双策略的对称博弈中
如果a大于c
或a等于c且b大于d
S是进化稳定的
这意味着什么呢
意味着为了使S成为一个
进化稳定策略
用S应对策略S的回报
不能小于用策略T应对
策略S取得的回报
也就是说我们要有a大于等于c
如果a等于c
也就是说策略S和T在
应对策略S时收益是相等的
这时候我们为了保证S
是一个进化稳定策略
我们必须要有什么
我们必须要有采取策略S
应对策略T的收益也就是b
要严格大于采取策略T
应对策略T的收益d
也就是必须要满足这样一个条件
我们可以看一下
在我们给定一个收益矩阵之后
比如说我们刚才介绍的
若干个那种收益矩阵
我们基于上下文
我们是可以讨论是不是这个
收益矩阵里面存在纳什均衡
也可以讨论这里面哪个策略
是进化稳定的
也就是说如果这个
收益矩阵表达的是一个比如
说零和博弈问题或者说
囚徒困境问题
那我们就可以来讨论纳什均衡
如果这个收益矩阵表达的是
一个生物进化的问题
那我们就要讨论进化稳定
但是我们现在考虑的问题是
我们能不能建立这两个概念的
某种关系呢
事实上我们是可以得到一些关系的
比如说我们可以看
对于这样一个收益矩阵
S是进化稳定的条件是什么
是a大于c
或a等于c且b大于d
(S S)是纳什均衡
的条件是什么呢
我们回忆下刚才的判断
是a大于等于c
因此我们可以说如果
这个策略S是进化稳定的
我们必然有a大于等于c成立
所以(S S)肯定是一个纳什均衡
但是反过来如果(S S)
它是一个纳什均衡
但不一定代表S是进化稳定的
这是由于什么呢
比如说(S S)它是一个纳什均衡
很可能是a等于c
但是如果我们没有条件b大于d
则S它不是一个进化稳定策略
按照我们刚才的判断
我们可以看一些例子
比如说我们在介绍博弈论时候
介绍的猎鹿博弈
我们可以看到
在这样一个猎鹿博弈里面
由于它满足的条件a大于c
也就是4大于3
所以猎鹿它是一个进化稳定策略
同样的我们可以看这个
收益矩阵的一个翻转
我们把猎兔 猎兔把它放在前面
同样它满足a大于c
所以猎兔它也是进化稳定的
由于猎鹿 猎兔都是进化稳定的
所以我们可以判断出
(猎鹿 猎鹿)
(猎兔 猎兔)都是纳什均衡
我们再看另外一种形式的猎鹿博弈
这时候这个收益矩阵
有些细微的变化
我们可以发现什么呢
当如果双方都是打鹿的话
他们的收益都是4
但是如果一方猎兔
另外一方猎鹿的话
猎兔的收益是4
猎鹿是0 在这种情况下
我们可以看到
它不再满足a大于c这个条件
a等于c
那我们要判断猎鹿是不是
进化稳定的
我们就必须比较b和d的值
也就是0和3
很可惜0小于3
所以猎鹿它不是进化稳定的
虽然我们可以对这个收益矩阵
分析发现(猎鹿 猎鹿)
仍然是纳什均衡
但是它不再是进化稳定的
猎兔它仍然满足了这样一个
进化稳定的条件
所以(猎兔 猎兔)
仍然是纳什均衡
我们可以看到a大于c
3大于0
它满足这样一个条件
所以它仍然是进化稳定
以及(猎兔 猎兔)
是纳什均衡的
我们现在进一步看一个新的概念
它叫做严格纳什均衡
严格纳什均衡是指
在一个策略选择中如果
每个参与人使用的都是
一个唯一的最佳应对
也就是说严格最佳应对策略
我们就称这样一个
最佳应对策略组是一个
严格的纳什均衡
在这里面我们不难看到
如果(S S)它是一个
严格纳什均衡
必须要有什么
必须要有a大于c
如果a大于c
我们可以得到什么结论
我们可以得到S它是进化稳定的
但是大家要注意什么呢
这个结论反过来不一定成立
为什么 当S是进化稳定的
它可能是a等于c且b大于d
这时候就不能满足
a大于c这个条件
所以它的反之这个结论是不成立的
我们到现在为止就介绍了
进化博弈论里面的一些重要的概念
生物的适应性 进化稳定策略
我们同样还介绍了进化稳定策略
与纳什均衡的关系
本讲主要是介绍了进化博弈论中
进化稳定策略与传统博弈论
中纳什均衡的关系 谢谢
-第1讲:社会网络的结构与关系强度
--Video
--三元闭包
-第2讲:同质性
--Video
--同质性
-第3讲:社会网络中的正负关系及平衡
--Video
-第4讲:博弈论简介(1):占优策略
--Video
--严格占优策略
-第5讲:博弈论简介(2):纳什均衡
--Video
--纳什均衡
-第6讲:博弈论简介(3):混合策略纳什策略
--Video
-第7讲:进化博弈论(1):进化稳定策略
--Video
-第8讲:进化博弈论(2):进化稳定策略与纳什均衡的关系
--Video
-第9讲:博弈论应用:交通网络流分析
--Video
-第10讲:博弈论应用:拍卖分析
--Video
-第二部分 博弈论--习题
-第11讲:匹配市场
--Video
--二部图匹配
-第12讲:中间商市场
--Video
-第13讲:社交关系价值的均衡
--Video
-第14讲:万维网的结构
--Video
-第15讲:网络信息的链接分析
--Video
-第16讲:搜索引擎中的广告市场:匹配市场机制
--Video
-第17讲:搜索引擎中的广告市场:GSP和VCG机制
--Video
-第四部分 信息网络与万维网--习题
-第18讲:信息级联
--Video
--信息级联
-第19讲:网络效应
--Video
--网络效应
-第20讲:网络中的级联行为
--Video
--网络级联
-第21讲:小世界现象
--Video
--网络效应
-第六部分 网络动力学:结构模型--习题
-第22讲:市场与信息(1):外生事件
--Video
-第23讲:市场与信息(2):内生事件
--Video
--市场与信息
-第24讲:表决
--Video
--表决
-第七部分 机构及其聚合行为--习题




