当前课程知识点:网络、群体与市场 > 第二部分 博弈论 > 第4讲:博弈论简介(1):占优策略 > Video
各位同学 大家好
欢迎来到网络 群体与市场的
在线课堂
我是这门课的主讲老师——石兵
来自武汉理工大学
在这门课刚开始的时候
我们介绍到对网络结构的分析
我们采用图论
那么对网络行为的分析
我们该采用什么方法呢
这就是我们这一讲和
接下来几讲将介绍的博弈论
在网络行为分析中主要采用
博弈论的方法对网络行为
各个节点的行为特征来进行分析
在这一讲我们将介绍
博弈论的基本概念
它的占优策略以及最佳应对
那么什么是博弈呢
我们从一个例子开始介绍
假设在截止日期的前一天
你有两件事情要做
一个是你要复习考试
另外一个就是要准备一份报告
由于时间有限
你只能选择其中一项来做
然后
你的考试成绩是可以预计的
如果你复习的话
你的考试成绩可以得到92分
如果没有复习
则只能得到80分
准备一份报告需要
你和你的拍档两个人合作完成
如果你和你的拍档都准备报告
则每个人都可以得到100分
如果只有一人准备报告
则每人都是92分
两人都没有准备报告
则两人最终都只是84分
我们假设你和你的拍档
都会追求平均成绩的最大化
你和你的拍档的平均成绩是等于
你们的考试成绩加报告成绩
的平均分
所以你和拍档都准备报告的时候
你们的平均成绩是
(80+100)/2=90分
但是你和你的搭档都是
准备考试则平均成绩是
(92+84)/2=88分
如果一方复习考试
一方准备报告
则准备报告的可以得到86分
而复习的只能得到92分
那现在问题是这样的
你和你拍档选择做什么呢
你是应该来复习考试
还是应该准备报告
我们假设你和你的拍档没法商量
只能各自独立地考虑这个问题
我们其实可以对前面这个问题
可以用一个收益矩阵来表达
收益矩阵是表达博弈问题的
一种非常直观的方式
这就是一个典型的收益矩阵
在这个收益矩阵里面
我们可以看到有你和你的拍档
作为这个博弈问题的参与人
然后还包括了你们可以选择的策略
在这里面的你们的策略就是
准备报告 复习考试
同样地 对于你的拍档
他也可以同样选择
准备报告 复习考试
这个收益矩阵里面的单元格
表达的就是在你们选取
合适的策略之后你们的收益
在我们这个问题里面
表达的就是你的平均成绩
比如说当你选择准备报告
而你的拍档选择复习考试的时候
你可以得到86分
而你的拍档可以得到92分
这个就是在你们选择特定的
策略下你们的回报
针对刚才这样一个收益矩阵
我们可以看到一个博弈问题
它会含有这样一些要素
有三个要素 一个就是参与者
我们刚才那里面参与者就是
你和你拍档
第二个就是策略集
策略集是什么呢
就是每个参与者都有一组关于
如何行为的所有可能的策略
组成的一个集合
在刚才那个问题里指的就是
你是复习考试还是准备报告
第三个要素就是你的收益或者说回报
是指在每个策略行为的选择下
会使参与人得到一个收益
当然这个收益不单取决于你的行为
还受到其他人策略行为的影响
这时候就会产生一个概念叫做策略组
策略组它是由每个参与者
出一个策略构成的一个组合
给定一个策略组
每个参与人都会得到一个相应的收益
假设说参与人1出的策略是S
参与人2出的策略是T
这时候我们可以得到
一个策略组(S,T)
那么参与人1的收益就是
P1(S,T)
参与人2的收益就是
P2(S,T)
刚才我们已经介绍了
博弈的一些基本要素
那我们现在看给定一个博弈问题
之后你该怎么来进行推理呢
在做推理之前我们要做一些
基本的假设
第一个假设就是说每个参与人
对这个博弈的结构
也就是收益矩阵有非常充分地了解
也就是他能够知道每个人选择
什么样的行为会得到多少的收益
第二个假设就是说每个人都是理性的
理性是指每个博弈的参与人
都会追求自己利益的最大化
也就是说给定其他人的策略
如果你发现
我改变当前的策略
我能得到更好的收益
那你会毫不犹豫地放弃当前的策略
然后换一个更好的
并且其他每一个参与人都是这样的
另外第三点假设就是说决策是独立地
也就是说在这个博弈的过程中
你们之间是不能商量的
也就没有协议联盟之类的
基于前面的假设
我们现在看刚才这样一个博弈的例子
你该采取什么样的行为
我们可以看到
当你和你的拍档做选择的时候
你要考虑你的对手的策略
比如说当你的拍档选择
准备报告的时候
对于你 你有两种选择
准备报告或者复习考试
当你准备报告的时候你的收益是90
而当你复习考试的时候
你的收益是92
显然
在这种情况下你应该选择复习考试
另外如果的你拍档是选择复习考试
这时候你同样有两种策略可以选择
你可以选择准备报告
得到的成绩是86分
或者选择复习考试
得到的成绩是88分 这时候显然
你的最好的策略还是复习考试
同样地我们可以发现
对于你的拍档
他可以同样发现不管你
是准备报告还是复习考试
这个拍档他总会发现他
复习考试得到的分数会更加高
这时候我们就产生了一个概念
叫做严格占优策略
严格占优策略是指什么呢
对一个参与人来说
如果存在这样一个策略
无论他的对手采取何种行为
这个策略总是他的最佳选择
我们就称这样一个策略是
严格占优策略
而且按照我们前面的
博弈问题的基本假设
显然 在选择严格占优策略
的时候参与人的收益可以最大化
因此参与人会毫不犹豫地选择
严格占优策略
在我们这样一个例子里面
复习考试对双方来说都是
严格占优策略
接下来我们从一个比较形式
的角度来定义它
首先我们介绍一个概念叫做最佳应对
最佳应对是指什么呢
我们假设S是参与人甲的一个策略
T是参与人乙的一个策略
则在这个时候我们有这样一个单元格
对应策略组(S,T)
我们用P1(S,T)
表达的是参与人甲从这组决策中
得到的收益
P2(S,T)表达的是
参与人乙从这组决策中得到的收益
那么什么是最佳应对呢
最佳应对是指针对参与人乙的策略T
如果参与人甲采用的策略S
产生的收益大于或等于自己的
任何其它策略
我们就称参与人甲的策略S
是参与人乙的策略T
的最佳应对
那么现在有一个问题
大家可以思考一下
这个最佳应对是不是一定存在
如果存在是否唯一
其实我们深入思考
可以发现最佳应对肯定是存在的
并且还不唯一
我们接下来把最佳应对的概念
再进一步拓展一下
就是严格最佳应对
严格最佳应对是指什么呢
如果S会产生比任何对应策略T
的其他策略都更高的收益
我们就称参与人甲的策略S
是对于参与人乙的策略T
严格最佳应对
请大家注意一下这个不等式
由于是严格最佳应对
所以是严格大于
那么同样有这样一个问题
严格最佳应对是不是肯定存在
如果存在是否唯一
我们思考一下可以发现
严格最佳应对不一定存在
但是如果存在则必定是唯一的
我们刚才介绍了最佳应对以及
严格最佳应对
基于此我们可以进一步
更加严格地定义占优策略以及
严格占优策略
对于参与人甲来说
他的占优策略S是指
这个策略对于参与人乙的
每一个策略来说
他都是最佳应对的
而对于参与人甲的
严格占优策略S是指这个占优策略
对于参与人乙的
每一个策略来说它都是
严格最佳应对
我们需要注意的是
占优策略这个概念是相对于
对方所有的策略而言的
也就是说对于对手的所有的策略
这个占优策略都是最佳应对
而最佳应对呢
这个策略是针对单个策略而言的
另外我们可以想到
如果参与人他有严格占优策略
则我们可以预计他肯定会
采取这个策略
我们接下来看另外一个博弈的例子
这个叫做营销战略博弈
我们假设有两个公司
公司1和公司2
他们要选择生成什么档次的商品
他们可以选择生产廉价的
或者高档次的
如果这两个公司分别定位生产
不同档次的商品
比如说公司1生产廉价的
公司2生产高档的
他们会得到这个商品市场的全部份额
我们假设高档市场的份额是40%
廉价市场的份额是60%
另外我们还规定
由于公司1的品牌形象比较好
所有在两个公司进入
同一种类型的市场
比如说都进入廉价的
或者说都进入高档次的
公司1可以得到80%的市场份额
而公司2只能得到20%
这时候的问题就是说
公司1和公司2
他们应该做什么样的选择
他们应该生产廉价的还是
应该生产高档次的
我们可以把刚才的一番描述
用收益矩阵来表达
在这个收益矩阵里面我们可以看到
有公司1和公司2
他们有策略
生产廉价或者生产高档商品
然后这个单元格里的数字
就代表他们的收益
比如说当公司1选择生成廉价的
公司2选择生成高档的
则这个时候公司1可以得到
廉价市场的所有份额
公司2可以得到
高档市场的所有的份额
所以他们的收益分别是
0.6和0.4
基于这个收益矩阵我们可以来分析
公司1和公司2
他们该选取什么样的策略
我们可以发现当公司2
选择廉价策略的时候
公司1它的最优策略
就是生产廉价的
这是由于0.48是大于0.4的
另外当公司2选择考虑
生产高档商品的时候
公司1同样发现
还是会选择生产廉价商品
由于0.6是大于0.32的
也就是说不管公司2选取什么策略
公司1都会发现我就生产廉价商品
这就是我的占优策略
那我们进一步发现
对于公司2来说是否有占优策略呢
我们发现 很可惜没有
比如说 当公司1
选择生成廉价商品的时候
公司2的最好的策略是高档的
但是当公司1选择高档商品的时候
公司2的最好的策略是生产廉价的
因为0.6大于0.08
所以说对公司2来说
不存在严格占优策略
但是我们可以发现没有关系
由于公司1有严格占优策略
所以它肯定会选择这个策略
而对公司2来说
它只要选择针对公司1这个
占优策略的最佳应对就可以了
也就是说公司2会选择
高档次的商品
我们现在对刚才的内容
做一个初步的总结
对一个简单的博弈问题
如果两个人都有严格占优策略
则我们可以预计他们肯定会
采取这样一个策略
如果只有一方有严格占优策略
则这人会采取严格占优策略
他的对手会采取
这个策略的最佳应对
但是带来的问题是
如果两个人都没有
严格占优策略呢
我们将会在下一讲
来解决这个问题
这一讲就是关于博弈论的
一些基本概念
比如说占优策略 最佳应对等等
谢谢
-第1讲:社会网络的结构与关系强度
--Video
--三元闭包
-第2讲:同质性
--Video
--同质性
-第3讲:社会网络中的正负关系及平衡
--Video
-第4讲:博弈论简介(1):占优策略
--Video
--严格占优策略
-第5讲:博弈论简介(2):纳什均衡
--Video
--纳什均衡
-第6讲:博弈论简介(3):混合策略纳什策略
--Video
-第7讲:进化博弈论(1):进化稳定策略
--Video
-第8讲:进化博弈论(2):进化稳定策略与纳什均衡的关系
--Video
-第9讲:博弈论应用:交通网络流分析
--Video
-第10讲:博弈论应用:拍卖分析
--Video
-第二部分 博弈论--习题
-第11讲:匹配市场
--Video
--二部图匹配
-第12讲:中间商市场
--Video
-第13讲:社交关系价值的均衡
--Video
-第14讲:万维网的结构
--Video
-第15讲:网络信息的链接分析
--Video
-第16讲:搜索引擎中的广告市场:匹配市场机制
--Video
-第17讲:搜索引擎中的广告市场:GSP和VCG机制
--Video
-第四部分 信息网络与万维网--习题
-第18讲:信息级联
--Video
--信息级联
-第19讲:网络效应
--Video
--网络效应
-第20讲:网络中的级联行为
--Video
--网络级联
-第21讲:小世界现象
--Video
--网络效应
-第六部分 网络动力学:结构模型--习题
-第22讲:市场与信息(1):外生事件
--Video
-第23讲:市场与信息(2):内生事件
--Video
--市场与信息
-第24讲:表决
--Video
--表决
-第七部分 机构及其聚合行为--习题





