当前课程知识点:微观经济学 > 10. 博弈论初步 > 10.2 完全信息静态博弈:纯策略均衡 > 10.2 完全信息静态博弈:纯策略均衡
同学们好
我是经济学院的刘盈曦老师
今天我们学习的内容是
完全信息静态博弈:纯策略均衡
完全信息是指
所有参与人都知道
所有人的策略和支付
静态博弈是指
参与人同时进行决策或行动的博弈
所谓同时
并不是时间意义上的概念
而是指参与人在做决策时
并不知道其他参与人的决策
我们从大家熟悉的
寡头博弈的例子开始
假定在某个市场上
只有甲乙两个厂商
每个厂商都有合作和
不合作两个可供选择的策略
此时如果两个厂商都采取合作的策略
例如他们组成卡特尔
然后都遵循卡塔尔的协议
那么他们就可以分别得到
5和6个单位的支付
如果两个厂商都采取不合作的策略
比如像古诺模型那样
那么他们只能分别得到
2和3单位的支付
如果厂商甲采取合作的策略
而厂商乙采取不合作的策略
比如厂商甲遵守卡特尔协议
而厂商乙违背卡特尔协议秘密降价
那么厂商甲
只能得到1个单位的支付
而不合作的厂商乙
可以得到5个单位的支付
最后如果厂商甲不合作
而厂商乙合作
那么厂商甲可以得到
7个单位的支付
而厂商乙只能得到1个单位的支付
对于以上这个
有两个参与人参与博弈
而且两人同时进行决策的博弈
我们可以用一个二元数组
为元素的矩阵
来描述这个博弈
我们称它为
博弈矩阵或者支付矩阵
矩阵的左边
表示厂商甲的策略
合作或者不合作
上面表示厂商乙的策略
是合作或不合作
矩阵中4个单元格的数字
分别表示博弈的4个结果集支付
其中每一个数字组合的
第1个数字是厂商甲的支付
而第2个数字是厂商乙的支付
例如当厂商甲选择合作
厂商乙也选择合作时
得到的支付对应左上角
单元格的数字是5和6
代表厂商的的支付是5
厂商乙的支付是6
由这个寡头博弈的支付矩阵
可以看出厂商甲和厂商乙
都有合作和不合作两个策略
合起来两个厂商共有4个策略组合
即合作合作
合作不合作
不合作合作
不合作不合作
其中每个括号的前一项
都是厂商甲的策略
后一项是厂商乙的策略
现在的问题是
那么在这4个策略组合中
哪一个是最优的呢
接下来我们就介绍
条件策略和条件策略组合
我们来看厂商甲的决略
当厂商乙选择合作时
厂商家选择不合作
可以得到7的支付
而选择合作只能得到5的支付
因此
不合作是厂商甲此时的最优策略
我们把厂商甲在厂商乙
选择合作条件下的最优策略
即不合作
叫做厂商甲的条件优势策略
简称条件策略
我们把与厂商甲的这一条件策略
相联系的条件组合
即不合作 合作
叫做厂商甲的条件优势策略组合
简称条件策略组合
其次厂商乙选择不合作时
厂商甲选择不合作
可以得到2的支付
选择合作只能得到1的支付
因此厂商甲此时最好也选择不合作
厂商甲在厂商乙
选择不合作条件下的最优策略
仍然是不合作
这是厂商甲的另一个条件策略
与这一条件策略相联系的策略组合
不合作 不合作
是厂商甲的另一个条件策略组合
由此可见
厂商甲有两个条件策略
当厂商乙选择合作时
商家甲选择不合作
当厂商乙选择不合作时
厂商甲仍然应该选择不合作
与此相联系也有两个条件策略组合
即不合作 合作
和不合作 不合作
类似的 相同的方法可以分析出
厂商乙也有两个条件策略
当厂商甲选择合作时
商家乙选择合作
当厂商甲选择不合作时
厂商乙应该选择不合作
与此相联系也有两个条件策略组合
即合作 合作
和不合作 不合作
接下来我们分析
这个博弈中的最优策略组合
即纳什均衡
在刚才二人寡头博弈中
甲乙厂商分别有两个条件策略
和与此相联系的两个条件策略组合
合起来共有4个条件策略
和4个条件策略组合
条件策略或条件策略组合
具有一个非常重要的性质
它代表了博弈中某个参与人
在某个条件下的均衡状态
例如甲厂商的条件策略组合
不合作 合作
当厂商乙选择合作时
厂商甲选择不合作是最优的
因而厂商甲没有改变策略的倾向
尽管此时厂商乙想改变自己的策略
由此可以想到
如果要让厂商甲和厂商乙
同时都不再有单独改变策略的倾向
其要求必然是
他们的条件策略组合恰好是相同的
因此在二人寡头博弈中
只有在策略组合不合作 不合作
既是厂商甲的条件策略组合
也是厂商乙的条件策略组合
故在这个条件策略组合上
厂商甲和厂商乙
都没有单独改变策略的倾向
而在其他策略组合中
例如合作 合作
尽管是厂商乙的条件策略组合
从而厂商乙
在该组合处不会单独改变策略
但却不是厂商甲的策略的组合
从而厂商甲在这个策略组合上
仍然有单独改变策略的倾向
就是说当厂商乙选择合作时
厂商甲不想选择合作
更想选择不合作
因为此时选择不合作
对厂商甲而言是更优的
同样的方法我们可以分析
不合作 合作
和合作 不合作两个条件组合
当两个厂商的条件组合恰好相同
从而两个厂商
都不再有单独改变策略的倾向时
整个博弈就达到了均衡
博弈的均衡是博弈各方
最终选取的策略组合
是博弈的最终结果
是博弈的解 称为纳什均衡
更严格的说
所谓纳什均衡指的是
参与人的这样一种策略组合
在这个策略组合上
任何参与人单独改变策略时
都不会得到好处
或者说如果在一个策略组合中
当其他所有人都不改变策略时
没有人会改变自己的策略
那么该策略就是一个纳什均衡
在纳什均衡的定义中
有两个问题需要注意
第一 单独改变策略
是指任何一个参与人在所有其他人
都不改变策略的情况下
改变自己的策略
其他人也同时改变策略的情况
不会考虑在内
第二 不会得到好处
是指任何一个参与人
在单独改变策略之后
自己的支付不会增加
要么支付减少 要么支付不变
接下来 我们介绍
寻找纳什均衡的方法
条件策略下划线法
寻求纳什均衡的方法
也可以用更直观 更方便的方法
条件策略下划线法进行
当厂商乙选择合作时
厂商甲的条件策略是不合作
此时他得到的支付7
于是我们在这个7的下面画一条线
并用这个下面带线的数字
表示厂商甲的条件策略
用包含7的支付组合7 1
来表示厂商甲的条件策略组合
不合作 合作
类似地
当厂商乙选择不合作时
厂商甲的条件策略也是不合作
此时他得到的支付是2
于是我们在2这个数字下再画一条线
当厂商甲选择合作时
厂商乙的条件策略是合作
得到的支付是6
我们就在6下面划一条线
当厂商甲选择不合作时
厂商乙的条件策略是不合作
得到的支付是3
我们在3下面划一条线
最后只要找到在两个数字之下
都划线的单元格
那么这个单元格所对应的策略组合
就是我们的纳什均衡策略组合
在我们的寡头博弈当中
2 3两个数字下都有划线
因此它们对应的策略组合
不合作 不合作
就是我们寡头博弈的纳什均衡
纳什均衡有四种特性
存在性 唯一性 稳定性和最优性
接下来我们就对这四种特性
进行一些简要的分析
第一 纳什均衡的存在性
在完全信息静态博弈中
纳什均衡既可能存在
也可能不存在
比如下面这个博弈的例子
我们使用划线法
求解纳什均衡可以发现
没有一个策略组合
相对应的两个数字下都有划线
也就是说不存在纳什均衡
第二 纳什均衡的唯一性
在完全信息静态博弈中
如果纳什均衡存在
它既可能是唯一的
也可能是不唯一的
我们之前探讨的寡头博弈
就是一个唯一纳什均衡的例子
但纳什均衡也可能是多重的
比如我们这个例子
使用划线法,可以发现
这个例子中存在着
上下和左右有两个纳什均衡
值得注意的是
当纳什均衡不存在或不唯一时
我们无法对博弈的最终结果
作出肯定的说明
因为当纳什均衡不存在时
博弈是否还有所谓的最终结果
本身就是一个问题
而当纳什均衡不唯一时
尽管我们知道最终结果应当是
多个纳什均衡中的某一个
但却无法知道究竟是哪一个
第三 纳什均衡的稳定性
在完全信息博弈中
如果纳什均衡存在
它既可能是稳定的
也可能是不稳定的
我们之前学过的
寡头垄断的博弈中
纳什均衡是稳定的
从任意一个非均衡的支付组合出发
最终都会调整到均衡的支付组合
下面这个博弈中的纳什均衡
则是不稳定的
无论从哪一个非均衡的支付组合出发
都不会调整到均衡的支付组合
第四 纳什均衡的最优性
在完全信息静态博弈中
如果纳什均衡存在
则它既可能是最优的
也可能不是最优的
比如在以下这个例子当中
存在两个纳什均衡上左和下右
尽管其中的第1个纳什均衡
上左是最优的
因为与它相对应的支付组合5 6
大于所有的其他支付组合
但第2个纳什均衡下右
却不是最优的
因为它的支付组合较小
最后 我们讨论一下
纳什均衡和社会福利
我们已经知道纳什均衡
可能是最优的 也可能不是最优的
但这里需要强调的是
纳什均衡的最优或非最优
仅仅是对博弈的参与者而言
而非对整个社会而言
对参与人最优并不意味着
对整个社会来说也是最优的
我们以囚徒困境为例来说明这个问题
假设张三和李四
以前曾经抢过银行
后来在一次偷汽车的时候被抓住了
警察把他们隔离起来关押
并分开进行审问
向他们每一个人提出以下交易
现在你偷了汽车
如果你和你同伙
都不承认前不久抢了银行
那么我们就关你一年
但是如果你承认你和你的同伙
抢了银行
而你的同伙却拒不承认
那么我们把你就把你放了
而你的同伙则要被关10年
反过来 如果你不承认
而你的同伙招了
那么你的同伙就可以获得自由
而你要被关10年
不过如果你和你的同伙都承认了
前不久抢银行的事情
那么就把你们两个人都关8年
我们把这个囚徒困境
化成博弈矩阵的形式
然后使用划线法来求解纳什均衡
可以发现求出来的纳什均衡是
坦白 坦白
在这个博弈中张三和李四
两个人的条件策略都是坦白
因此对两个人而言
最后的结果就是纳什均衡
会出现的两个人都会坦白
分别坐牢8年
但这并不是最好的结果
因为如果两个人都不坦白
则每个人只需要坐牢1年
但张三和李四
会不会都拒不坦白呢
不会的
因为一方面张三会想
最好的结果是李四不坦白 而我坦白
如果李四不坦白
我坦白我就不用坐牢了
但李四也可能坦白
如果李四坦白我怎么办呢
我最好还是坦白
因为如果我不坦白
我就要做10年牢
而我坦白了只需要做牢8年
因此不管李四是坦白还是不坦白
张三会想我最好都要坦白
另外一方面李四也会同样的想法
因此张三和李四的条件决策都是坦白
结果是两个人都坐牢8年
总共要坐牢16年
这个结果比两个人都不坦白
都坐牢1年要坏的多
由此可见在有些情况下
每个人都追求自己的利益
可能既不给自己带来好处
也不能给别人带来好处
在这里看不见的手就失灵了
好的 今天的内容到这里就结束了
感谢大家的观看
-1.1 什么是西方经济学
-1. 2 现代西方经济学的由来和演变
-1.3 微观经济学的基本框架
-2.1 需求曲线和供给曲线
-2.2 价格的决定及其变动
-2.3 弹性的概念及弧弹性
-2.4 需求的价格点弹性及其影响因素
-2.5 供给弹性和其他弹性
-2.6 供求曲线的运用事例
-第二章作业题
-3.1 基数效用论和边际效用分析法
-3.2 消费者剩余
-3.3 序数效用论及无差异曲线
-3.4 边际替代率递减规律及无差异曲线的特殊形状
-3.5 预算线及其变动情况
-3.6 效用最大化与消费者选择
-3.7 价格变化和收入变化对消费者均衡的影响
-3.8 正常品的替代效应和收入效应
-3.9 劣等品的替代效应和收入效应
-第三章作业题
-4.1厂商和生产的基本概念
-4.2 短期生产函数
-4.3 长期生产函数
-第四章作业
-5.1 成本的基本概念
-5.2 成本最小化
-5.3 扩展线和生产总成本
-5.4 短期成本曲线
-5.5长期成本曲线
-第五章作业
-6.1市场概述
--6.1市场概述
-6.2市场类型的划分和特征
-6.3.1完全竞争市场概述(上)
-6.3.2完全竞争市场概述(下)
-6.4完全竞争厂商的短期均衡的研究思路
-6.5 完全竞争厂商的短期均衡
-6.6 完全竞争厂商的短期供给线
-6.7 完全竞争厂商的长期均衡
-6.8.1 完全竞争厂商的长期供给线(上)
-6.8.2完全竞争厂商的长期供给线(下)
-6.9 完全竞争市场的简要评述
-第六章作业
-7.1垄断
--7.1垄断
-7.2垄断竞争市场
-7.3寡头市场
--7.3寡头市场
-第七章作业
-第八章作业
-9.1一般均衡与经济效率
-9.2帕累托最优条件
-第九章作业
-10.1 博弈论和策略行为
-10.2 完全信息静态博弈:纯策略均衡
-第十章作业
-11.1不完全竞争
-11.2外部影响
--11.2外部影响
-11.3公共物品和公共资源
-11.4信息的不完全和不对称
-第十一章作业