当前课程知识点:产业组织理论 > 第十周 博弈论初步 > 1. 囚徒困境与纳什均衡 > Video
大家好 今天开始学习博弈论
有两类的博弈
先从静态博弈讲起
之后再讲序贯博弈
在介绍博弈这个概念之前
先从现实生活中的一个例子
看一看什么样的情况叫做博弈
我们考虑
比如宝洁和联合利华这样两个公司
它现在需要做一个
是否做广告的决策
那就把它叫做一个广告博弈
假设他们在考虑的这个产品
就是一种简单的洗涤剂产品
那两家公司
都可以选择去做广告
如果他做广告的话
成本就是十
如果只有一家公司做广告
那做广告的这家公司
就会获得二十五的额外利润
但是对手在这种情况下
就会损失二十五
也就是说做广告的一家公司
从对手那里抢走了二十五
可以代表一定市场份额的利润
如果两家公司都做广告
或者都不做广告
那么他的利润
就都没有什么变化
其实背后的假设
就是说这个市场已经饱和了
这两家的产品
都已经占满了整个市场
总结一下
如果两家都做广告的话
那他们的利润没变化
但是他们都要付出广告的成本10
如果都不做广告
当然没有成本
也没有额外的利润收入
但是如果只有一家做广告
另一家不做广告
那做广告这家
就会从不做广告那家公司
获得额外的二十五的利润
把刚才这些数字
放在一个表格里做一个展示
把这个宝洁
现在放在这个表格的行的一部分
而联合利华公司放在表格的列这一部分
那其中这
宝洁和联合利华分别的两个选择
也就是说做广告或者不做广告呢
分别用这表格的两行和两列来表示
然后把刚刚算出来
那些数字的利润变化数值
放在这个表格的内容里面
比如说现在看一下表格总共有
上下左右四个格子
所以左上角这个格子
里面代表了双方
都在做广告时候
他们的利润的变化
也就是说都付出了广告成本10
但是没有额外
发生什么变化
但是当两家都不做广告的时候
连这个成本也省下来了
所以都没有任何的变化
如果其中一家公司做广告
比如说宝洁做广告
那就是第一行联合利华不做广告
就是第二列
所以看到第一行 第二列的那个格子
里面写的是左边的数字
是负十加二十五
代表的是宝洁
在这种情况下付出了
广告的成本10
但是 从联合利华那里
得到了二十五的利润
这种情况联合利华就损失了二十五
所以联合利华的利润
是用负二十五这个数字来代表
另外一种情况就是
宝洁不做广告
而联合利华做广告
那么他们的收益的变化
就正好相反互换了一下
在这表格里
我们把刚刚这个描述
这个博弈论里面的一些概念
给大家定义一下
在这个博弈里
就把宝洁和联合利华
叫做这个博弈的参与者
那其中任何一个参与者
他的选择都叫做
在这个博弈里面的策略
所以宝洁有两个策略
联合利华也有两个策略
那这个表格里面的数字
把它叫做这个博弈里面的收益
其中的第一个数字
每一个结果里面的
第一个数字代表的是行
参与者的收益
也就是在这个博弈里面是宝洁的时候
写这个表格里面的第一个数字
那第二个数字
那就是列 参与者的收益
就是联合利华
在这个博弈里面获得的收益
总结一下
已经把这个博弈 定义清楚了
这个博弈里面有
参与者策略和他们各自的收益
所以已经把这个市场中的情况
抽象成这样一个表格
用一个博弈的形式表示出来了
这就是一个静态博弈的表示方式
表示之后我们最关心的
还是这样的市场情况下
会发生什么结果
所以
在学习之前先告诉大家
这个解其实是两家企业
都会选择做广告
那么在这种情况下双方的收益
都分别是负十
在讲解为什么会发生这样的结果之前
先统一的介绍一下
对于博弈论
我们怎么样认识
我们也用一本非常著名的
博弈论教材上面的一些介绍
来告诉大家
博弈论是什么样的一个方法
它其实提供了一套分析工具
用来帮助我们理解
当多个决策者的决策过程
发生了互动的时候
这样的现象应该怎么样去理解
它有两个最基本的假设
第一个就是说决策者们
都有非常明确的目标
就是说他们在
这个博弈里面很清楚
自己想要获得什么
如果这个条件得到满足我们
就说这些参与者或者决策者们
是理性的
这个目标可以是任何的目标
只要他清楚就叫做理性
第二个假设是说决策者
在自己决策的过程中
都要把其他决策者所知
或者所预期的情况
都考虑在自己的决策之内
这句话的意思
其实是说任何一个决策者
自己都没法单方的决定
自己在一个博弈中的收益
其他决策者的选择
也会影响其他决策者
包括你自己在这个博弈
当中获得的收益
所以在这样的情况下
任何一个决策者都不能
只考虑自己的选择
也要考虑其他的决策者
会怎么做出选择
把这种情况叫做策略性的选择
所以说博弈论两个基本的假设
其中的一个是决策者是理性的
第二个是他们的考虑
都是策略型的
这是对于博弈论的一个简单的描述
现在引入两个比较有用的概念
帮助大家理解博弈
对刚刚看到那个广告
博弈作出求解
第一个概念叫做占优策略
如果有一个策略是占优策略
那其实说的是这个策略
比其它策略都好
他当然是说的是
某一个参与者的各种可以
选择的策略之中
最好的那个
所以就叫做占优策略
其中不管对手怎么选择
占优策略永远是我们所说的
这个参与者最优的
那个选择
如果一个参与者
有这样一个最优的选择
不管对手怎么做
这个策略都比其他的策略更好
显然这个测试
应该选择这个占优策略
回到广告博弈中
看一下这两个参与者
是不是也有占优策略
答案是肯定的
宝洁的占有策略是选择做广告
联合利华的占有策略
也是选择做广告
看一下为什么是这样
回到这个表格当中
我们看一下
先看宝洁的选择
占有策略说的是
不管对手怎么做广告
做广告总是宝洁的最佳选择
那么看看是不是这样
这个最诱惑的最佳
其实说的是参与者的收益更高的意思
那在宝洁的收益当中
如果联合利华选择了做广告
我们就在这个博弈的第一列
里面看一下
在这一列里面
宝洁的收益分别是它
通过做广告获得负十
或者通过不做广告
获得负二十五
那显然负十比负二十五更高
那做广告时
更好的选择
但是在联合利华
不做广告的时候
宝洁可以通过做广告
获得负十加二十五
也就是十五的收益
它也可以通过广告
获得零的收益
那显然十五又比零好
所以做广告仍然是宝洁
在这个情况下
得更更好的一个选择
所以不管联合利华
怎么做
做广告永远是宝洁
最优的选择
所以我们就说宝洁确实
在这个博弈当中
有占优策略
也就是做广告在这个博弈
当中宝洁和联合利华的地位
其实是对称的
可以把刚刚的这些分析同样
放在联合利华
联合利华也同样成立好的
那现在来介绍第二个
比较有用的概念
叫做被占优策略占优策略
那是以刚才的占优策略
直接相关的一个概念
如果策略x始终比z好
就是说X占有Z
或者说z被X所占有
如果存在一个策略 他占优z
那就把z说成被占有策略
被占有策略
其实这个概念的含义
是很明确的
只要你找能找到一个其他的策略
始终比这个策略Z更好
那么这个z就可以叫做
被占优策略
那如果有一个参与者
它存在这样一个被占优策略
那他当然永远
也不要选择这个策略
因为始终有另外一个策略
比他更好
现在再回到 刚才的广告博弈
当中看一下
宝洁和联合利华是否
有被占优策略呢
这个答案显然也是肯定的
那刚才已经叫过了
在广告博弈中宝洁和联合利华
都有占优策略
分别是他们选择做广告
他们的另外的那个选择
不做广告
就是分别是他们两个的
被占优策略
现在来看一下刚刚说的
占优策略和被占有策略
两个概念
怎么帮助我们求解一个博弈
其实可以把刚刚这两个概念
做一个简单的总结结论
就是永远也不要使用一个
被占优的策略
那现在重新回到刚刚的这个广告
博弈里来看一下
既然宝洁和联合利华都有占优策略
那在这一个博弈里
其实对于我
结果的预测是比较容易的
也就是说
他们都会选择自己的占优策略
去做广告
那这个博弈的结果
就是宝洁和联合利华两个公司
都分别获得了副食的手艺
但是仔细观察一下
这个博弈在这个博弈中
第二行第二列的那个结果里
也就是说两家公司
都选择不做广告的时候
那他们分别
都获得了零的收益
这个结果看起来
是比的两家都获得负十
收益更好的一个结果
为什么这个博弈没有获得一个
对两家更好的结果
而是获得了一两家
都有一定的损失
或者说成本的一个结果
这样的博弈一般把它叫做囚徒困境
博弈这类的博弈有这样两个特点
首先每个参与者
都有一个占优策略
就像这里宝洁和联合利华
都有做广告
是他们的占优策略
另外一个特点
就是刚刚描述的
这两个参与者的集体利益
和他们的个人利益之间
是有冲突的
我们看到宝洁联合利华
在这个博弈里
如果最大化自己的收益
他们分别会选择做广告
但是这个博弈
似乎有一个对两方都更好的结果
就是假设他们都不做广告
他们都能减少损失
也就是广告的成本
可以节省下来
但是刚才在我们的分析中
不做广告并不是
这任何一家公司的均衡选择
他们其实现实中
也不会这样做因为做广告
是他们的占优策略
他们都会选择
这样一个对自己更好的策略
在后面的讲解内容中
还会提到这样的情况
是不是可以解决
这种两家企业
是不是可以通过合作
或者其他的方式
来实现那个更好的结论
但是在现在这个静态博弈当中
确实只有一个结果
就是说两家都会选择做广告
两家的占优策略刚刚的分析中
其实我们已经
用到了两个假设
在这里把他们明确的提出来
第一个就是每个参与者
最大化自己的收益
也就是说他的目标是明确的
他们是理性的
第二个假设是说
这个博弈里面参与者
都有共同知识
共同知识指的下面
这些描述所表达的含义
第一步就是说所有的参与者
至少都知道这个博弈的参数
包括他们的策略是哪些
他们的回报如何
但是共同支持说的
不只是这一部他还要包括
每个参与者都知道其他参与者
知道这个博弈参数这件事
这与参与者自己知道这个博弈的参数
其实不是完全相同的一件事
但是共同知识也不是
到此为止的
共同知识还要求参与者
都知道其他的参与者
知道这个博弈的参数如此等等
也就是说
这是一环扣一环的一个假设
那这一环一环的是无穷无尽的
这个知识要一直
从开始的第一环到第二环到第三环
一直都成立才叫做共同知识
那就显然是一个很强的假设
但其实在刚才的分析中
已经用到了这样的假设
在行为博弈论中可能
可以放宽上面
这些假设当中的一些部分
这里边不做这样的介绍
讲博弈论就不能不讲
纳什均衡
现在就来正式的介绍一下
什么叫做纳什均衡
纳什均衡说的是
给定了参与者的选择
如果每个参与者
都选择了自己最佳的策略
那就说这些参与者的策略
放在一起组成了一个纳什均衡
纳什均衡首先是一个策略的组合
还包括了所有参与者的策略
而且在这个策略组合当中
每个参与者
都对其他参与者的选择
做出了最佳的反应
那这个最佳的反应
也给它一个名字叫做最佳回应
所以说一个纳什均衡
其实是一种自我实现的协议
没有人会单方面的愿意
改变这样一个选择
因为如果达到了纳什均衡
那么每一个参与者
都已经对其他参与者的选择
做出了最佳的反应
他们都没有单方面
修改自己选择的这样的机率
我们就把纳什均衡里
获得的收益
作为博弈的结果的一个预测
所以说这里 总结一下
纳什均衡其实是自我实现的协议
或者说你如果选择
纳什均衡策略的话你是不会后悔的
选择其他的策略就有可能会后悔
现在回到刚刚的广告博弈
其实我们刚刚找到的两家
都做广告这样的策略
选择组合在一起
就构成了广告博弈的纳什均衡
-微观经济学复习
--Video
-产业组织理论导言
--Video
-战略管理理论中的五力分析模型
--Video
-2.1单一定价与价格歧视
--Video
-2.2价格歧视的三种类型
--Video
-2.3两部收费法
--Video
-2.4价格歧视应用
--Video
-2.5交通成本和价格歧视
--Video
-练习题--作业
-垄断定价练习题之二--作业
-垄断定价练习题之三--作业
-3.1捆绑销售适用的条件
--Video
-3.2纯捆绑与混合捆绑
--Video
-3.3搭售
--Video
-第三周 捆绑销售与搭售--练习题
-捆绑销售与搭售练习题(续)--作业
-耐用品垄断定价决策
--5科斯猜想
-产品差异化
--5纵向差异化模型
-第四周 耐用品垄断与产品差异化--练习题
-1.案例:收购一家公司
--Video
-2.不对称信息与逆向选择
--Video
-3.逆向选择与市场信号
--Video
-4.道德风险与委托代理问题
--Video
-5.推销员的激励机制设计
--Video
-6.一体化企业的激励设计
--Video
-7.机制设计的故事
--Video
-8.揭秘央企高管薪酬 (改)
--Video
-第五周 不对称信息与机制设计--练习题
-信息不对称习题集(续)--作业
-广告经济学
--Video
-垄断竞争分析
--Video
-练习题--作业
-主导企业模型与卡特尔
--Video
-Case Aanlysis Oil Market and OPEC
--Video
-练习题--作业
-1. 囚徒困境与纳什均衡
--Video
-2. 纳什均衡应用
--Video
-3. 序贯博弈
--Video
-4. 序贯博弈应用:价格保证
--Video
-第十周 博弈论初步--练习题
-博弈论习题集(续)--作业
-双寡头
--Video
-3个及N个卖家
--Video
-先行者优势
--Video
-合谋与卡特尔
--Video
-练习题--作业
-寡头竞争(I)习题集(续)--作业
-博川德 Bertrand 模型
--Video
-霍特林 Hotelling 模型 1
--Video
-霍特林 Hotelling 模型 2
--Video
-练习题--作业
-寡头竞争(II)习题集(续)--作业
-横向合并
--Video
-双重加价
--Video
-Hold-Up问题和投资动机
--Video
-练习题--作业
-管制
--Video
-美国反托拉斯法里程碑
--Video
-两个反垄断的案例
--Video
-反垄断在中国
--Video
-练习题--作业