教育资源为主的文档平台

当前位置: 查字典文档网> 所有文档分类> 经管营销> 经济/市场> 第四章 重复博弈Word

第四章 重复博弈Word

上传者:涂小行
|
上传时间:2017-06-03
|
次下载

第四章 重复博弈Word

  第四章 重复博弈本章介绍基本博弈重复进行构成的重复博弈。虽然形 式上是基本博弈的重复进行,但重复博弈中博弈方的行为 和博弈结果却不一定是基本博弈的简单重复,因为博弈方 对于博弈会重复进行的意识,会使他们对利益的判断发生

  变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须 把整个重复博弈过程作为整体进行研究。

  第四章   重复博弈Word1

  4.1.1 为何研究重复博弈

  经济中的长期关系人们的预见性 未来利益对当前行为的制约 长期合同、回头客、长客和一次性买卖的区别 有无确定的结束时间

  第四章   重复博弈Word2

  4.1.2 基本概念

  有限次重复博弈:给定一个基本博弈G(可以是静态博弈,也可以是动态 博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前 博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G 则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。

  无限次重复博弈:一个基本博弈G一直重复博弈下去的博弈,记为G( 策略:博弈方在每个阶段针对每种情况如何行为的计划

  )

  子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分

  均衡路径:由每个阶段博弈方的行为组合串联而成

  第四章   重复博弈Word3

  重复博弈的得益

  1 2 2 3 T-1 T t 1 tt 1

  T

  G( , )

  1 2 2 3 t 1 tt 1

  第四章   重复博弈Word4

  平均得益 :如果一常数 作为重复博弈(有限次 重复博弈或 无限次重复博弈)各个 阶段的得益,能产生与 得益序列

  1, 2 , 相同的现在值,则称 为 1, 2 , 的平均得益有限次重复博弈不一定 考虑贴现因素 无限次重复博弈必须考 虑贴现问题 (1 ) t 1 tt 1

  第四章   重复博弈Word5

  如果抽到停止重复的概率为p,则抽到重复下去的概率为1-p,利率为 。

  1- p 1- p 2 1 2 ( ) 3 1- 1- 1 - p t 1 ( ) t t 1 t t 1 1 - t 1

  第四章   重复博弈Word6

  4.2 有限次重复博弈4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈

  的有限次重复博弈4.2.3多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理

  第四章   重复博弈Word7

  4.2.1 两人零和博弈的有限次重复博弈

  零和博弈是严格竞争的,重复博弈并不改变这一点。 以零和博弈为原博弈的有限次重复博弈与猜硬币博弈的有限次重 复博弈一样,博弈方的正确策略是重复一次性博弈中的纳什均衡 策略。

  上述结论也可以推广到非零或多

  个博弈方,但博弈方的利益严格对立,没有纯策略纳什均衡的其他严格竞争博弈中。在这些博弈

  作为原博弈构成的有限重复博弈中,惟一的子博弈完美纳什均衡就是所有博弈方都始终采用原博弈的混合策略纳什均衡策略

  第四章   重复博弈Word8

  4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈

  定理:设原博弈G有唯一的纯策 略纳什均衡,则对任意整数T,重

  囚徒2 坦 白 不坦白 囚 坦白 -5,-5 徒 1 不坦白 -8,0 0,-8-1,-1

  复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段 都采用G的纳什均衡策略。各博 弈方在G(T)中的总得益为在G中得 益的T倍,平均得益的与原博弈G

  (-5,-5) 囚徒2 坦 白 不坦白 囚 坦白 -10,-10 -5,-13 徒 -13,-5 -6,-6 1 不坦白 (-10,-10)

  中的得益。

  第四章   重复博弈Word9

  从结果看,两次重复囚徒困境相当于独立两次一次性的囚徒困境博弈,然后再把两次独立博弈的的得益相加。这个结果

  实际上具有一般意义。

  在有限次重复博弈中,如果原博弈存在唯一的纯策略纳什策 略组合,则有限次重复博弈中的唯一的均衡解即各博弈方在 每个阶段(即每次重复)中都采用原博弈的纳什均衡策略。

  由于在这样的双方策略下,均衡路径中的每个阶段都不存在 任何不可信的威胁或许诺(纳什均衡策略肯定是可信的), 因此这种均衡是子博弈完美纳什均衡。

  第四章   重复博弈Word10

  有限次重复削价竞争博弈

  寡头2 高 价寡 高价 头 1 低价 100,100 150,20

  有唯一纯策略纳什均衡低 价

  20,150 70,70

  (70,70) 有限次重复的结果仍然是 (低价,低价)

  削价竞争博弈

  第四章   重复博弈Word11

  重复囚徒困境悖论和连锁店悖论

  第四章   重复博弈Word12

  4.2.3多个纯策略纳什均衡博弈的 有限次重复博弈厂商2

  厂 商 1

  H M L

  H 5,5 6,0 2,0

  M 0,6 3,3 2,0 三价博弈

  L 0,2 0,2 1,1

  厂 H 商 M 1 L

  H 8,8 7,1 3,1

  厂商2 M 1,7 4,4 3,1

  L 1,3 1,3 2,2

  两次重复三价博弈的等价模型

  触发策略:两博弈方先试探合作,一旦发现对方不合作则也用 不合作报复。 博弈方1:第一次选H;如第一次结果为(H,H),则第二次选M, 否则选L 博弈方2:同博弈方1

  第四章   重复博弈Word13

  触发策略

  在上述双方策略组合下,两次重复博弈的路径一定为第一阶段 (H,H),第二阶段(M,M)这是一个子博弈完美纳什均衡路径。

  首先试探合作,一旦发觉对方不合作则也用不合作相报复的策

  略,称为“触发策略”。

  如果上面这个博弈的重复的次数不是两次,而是三次或者更多

  ,一般说n次,结论也是相似的。当重复的次数较多时,平均得益接近于一次性博弈中(H,H)的得益(5,5)。

  第四章   重复博弈Word14

  触发策略的进一步讨论厂商2 H 厂 H 商 M 1 L 8,8 9,3 5,3 M 3,9 6,6 5,3 L 3,5 3,5 4,4

  重复三价

  博弈的等价模型 不可信报复

  第一阶段最佳选择不是(H,H),而是(M,M)。

  这意味着两次重复博弈的均衡路径是二次(M,M)。实际上,触发策略中报复机制的可信性是一个很复杂的问题,会受到相互预期等 很多复杂因素的影响。

  第四章   重复博弈Word15

  博弈2 H 博 弈 1 H L M P Q 5,5 6,0 2,0 0,0 0,0 L 0,6 3,3 2,0 0,0 0,0 M 0,2 0,2 1,1 0,0 0,0 P 0,0 0,0 0,0 4,1/2 0,0 Q 0,0 0,0 0,0 0,0 1/2,4

  这个博弈与前面的三价博弈的差别知识两博弈方都增加了两个可选策略,它有四个 纯策略纳什均衡(M,M)、(L,L)、(P,P)和(Q,Q)。(H,H)不是纳什均衡。 博弈方1:在第一阶段采用H,如果第一阶段结果是(H,H),那么第二阶段采用M,否则采用P 博弈方2:在第一阶段采用H,如果第一阶段结果是(H,H),那么第二阶段采用M,否则采用Q 双方的上述触发策略组合构成该重复博弈的一个子博弈完美纳什均衡,而且双发的触 发策略中的报复都是可信的,因为双发触发策略中的报复机制不仅本身可以构成纳什

  均衡,而且自己也是有利的。

  第四章   重复博弈Word16

  两市场博弈的重复博弈(重复两次)A 厂 A 商 1 B 3,3 4,1 厂商2 B

  1,4 0,0

  两市场博弈

  (A,B)+(A,B) OR (B,A)+(B,A)——(1,4)(4,1) 连续两次采用混合策略——(2,2) 0.25(3+4+1+0)=2 (A,B)+(B,A) OR (B,A)+(A,B)——(2.5,2.5)轮换策略 一次纯策略+一次混合策略——(1.5,3)(3,1.5) 如果两市场博弈重复3次,则博弈的结果缺失会进一步的改善。

  第四章   重复博弈Word17

  重复博弈不同策略、均衡及一次性博弈得益比较

  不同策略组合、均衡得益图示厂商2 得益

  (1,4)(1.5,3)

  (3,3)

  (2.5,2.5) (2,2)(3,1.5) (4,1)厂商1得益

  第四章   重复博弈Word18

  二次重复时没有条件运用的触发策略,在三次以上的重复中有了运用的条件。例如现在厂商1和厂商2可以采用如下触发策略:

  厂商1:第一阶段选A;如果第一阶段结果是(A,A),则第二阶段选A,如果第一阶段结果是(A,B),则第三阶段无条件选B。

  厂商2:第一阶段选A;第二阶段无条件选B,如果第一阶段结果是(A,A),

  则第三阶段件选A;如果第一阶段结果是(B,A),则第三阶段选。

  根据双方的上述策略,3次重复博弈的均衡路径是(A,A)到(A,B)再到(B,A) 。其中第二、第三阶段本身就是原博弈的纳什均衡,因此不会有哪一方单

  独偏离。 (3+1+4)/3=2.67

  101次 (99*3+1+4)/101=2.99 接近(3,3) 如果重复博弈次数进一步增加,则接近程度还能进一步提高。

  第四章   重复博弈Word19

  4.2.4 有限次重复博弈的民间定理

  厂商2 得益

  (1,4) (3,3)

  w=(1.1) (1,1)

  (4,1)

  个体理性得益:不管其它博弈方的行为如 何,一博弈方在某个博弈中只要自己采取 某种特定的策略,最低限度保证能获得的 得益 可实现得益:博弈中所有纯策略组合得益 的加权平均数组 定理:设原博弈的一次性

  博弈有均衡得益 数组优于w,那么在该博弈的多次重复中所 有不小于个体理性得益的可实现得益,都 至少有一个子博弈完美纳什均衡的极限的 平均得益来实现它们

  厂商1得益

  第四章   重复博弈Word20

  在所有可实现得益或优于w=(1,1)的可实现得益中,只有处于(1,4)与(3,3)和(3,3)与(4,1)两条连线上,包括这三点本身的可实现得益有教重 要的意义,因为它们代表了帕累托效率意义上最有效的均衡得益。

  民间定理的关键意义正是在于保证这些得益有一定次数重复博弈的子 博弈完美纳什均衡的平均得益可以实现或逼近它们。

  这种结论对于帮助我们加强对重复博弈意义的理解,帮助我们在重复 博弈中更好地把握机会,设计和运用高效率的策略,建立相互的默契 和信任,从而争取实现更好的博弈结果,都有相当重要的意义。

  第四章   重复博弈Word21

  4.3 无限次重复博弈4.3.1 两人零和博弈的无限次重复博弈

  4.3.2 唯一纯策略纳什均衡博弈的无限次重复博弈

  4.3.3 无限次重复古诺模型4.3.4 有效工资率

  第四章   重复博弈Word22

  4.3.1 两人零和博弈的无限次重复博弈

  两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡。

  因为无限重复次数的无限增加也不能改变原博弈中博弈方之间在利益上的对立关系,也不会创造出潜在合作利益。

  第四章   重复博弈Word23

  4.3.2唯一纯策略纳什均衡博弈 的无限次重复博弈两寡头削价竞争博弈H L H 4,4 5,0 L 0,5 1,1

  该博弈一次性博弈均衡是都采用低价,是囚徒困境型博 弈

  第四章   重复博弈Word24

  无限次重复两寡头削价博弈触发策略:第一阶段采用H,如果前t-1阶段的结果都 是(H,H),则继续采用H,否则采用L。 如果博弈方2采用L,总得益现值为 5 1 1 2 ... 5 1 如果博弈方2采用H,总得益现值为V 4 V 4 5 1- 1 4 V 1

  因此当 1 / 4 时,此触发策略纳什均衡策略

  第四章   重复博弈Word25

  两寡头削价竞争无限次重复博弈的民间定理无限次重复博弈民间定 理:设G是一个完全信息 的静态博弈。用 (e1 , , en )记G的纳什均衡的得益, 用( xi , , xn )表示G的任意可实现得益。如 果xi ei厂商2 得益

  对任意博弈方i都成立,而 足够接近1,那么无限 次重复博弈G ( , )中一定存在一个子博弈 完美纳(5,0) (1,4) (4,4)

  什均衡,各博弈方的平 均得益为( x1 , , xn )

  (1,1)

  (4,1) (5,0)厂商1得益

  第四章   重复博弈Word26

  古诺模型的无限次重复博弈和支持垄断产量的条件假定: P 8 Q, 其中Q q q ,边际成本都为2。1 2

  在无限次重复古诺模型中,当贴现率 满足一定条件时,两厂商采用 下列触发策略构成一个子博弈完美纳什均衡:

  在第一阶段生产垄断产量的一

  半1.5;在第 t 阶段,如果前 t-1 阶段结果都是(1.5,1.5),则继续生产1.5,否则生产古诺产量2。 这种触发策略的实质同样是采用它的博弈方先试图合作,选择符合双方利 益的产量,而一旦发现对方不合作,偏偏对对方有利的产量,则也可以选择 纳什均衡产量来进行报复,双方都采取上述触发策略的博弈路径为每阶段都 采用(1.5,1.5),双方每阶段得益都为 *=4.5.

  第四章   重复博弈Word27

  古诺模型的无限次重复博弈和支持垄断产量的条件设厂商1已采用该触发策略,若厂商2也采用该触发策 略,则每期得益4.5,无限次重复博弈总得益的现值为:4.5 1 2

  4.5 1

  如果厂商2偏离上述触发策略,则他在第一阶段所选 产量应为给定厂商1产量为1.5时,自己的最大利润产量, 即满足:

  max 8 1.5 q q 2q max 4.5 q qq22

  2

  2

  q2

  2

  2

  解得 q 2.25 ,此时利润为5.0625,高于触发策略第 一阶段得益4.5。2

  第四章   重复博弈Word28

  古诺模型的无限次重复博弈和支持垄断产量的条件但从第二阶段开始,厂商1将报复性地永远采用古诺产 量2,这样厂商2也被迫永远采用古诺产量,从此得利润4。 因此,无限次重复博弈第一阶段偏离的情况下总得益的现 值为:4 5.0625 4 5.0625 1

  2

  当

  4.5 4 5.0625 即 9 17 1 1

  上述策略是厂商2对厂商1的同样触发策略的最佳反应, 否则偏离是最佳反应。

  第四章   重复博弈Word29

  二、低水平合作 9/17时上述触发策略不是无限次重复博弈的纳什均衡。虽然 较小时,因为远期利益的重要性不足,无限次重复博弈也不能促使两厂商把产量都,控制在qm/2=1.5的低水平,但还是有 可能使各厂商把产量都产量比古诺qc低的水平,即垄断产量的 一半qm/2和古诺产量qc之间某个中间产量水平q*。例如我们以 q*为基础构造一种双方共同采用的触发策略:

  在第一阶段生产q* ;在第t阶段,如果前t-1阶段的结果都是(q*,q*),则继续生产q* ,否则生产古诺产量qc =2.

  第四章   重复博弈Word30

  二、低水平合作双方都采用该触发策略时均衡路径为阶段都是(q*, q*),两厂

  商的得益为 *=(8-2q*)q*-2q*=(6-2q*)q*。我们假设厂商1已采用上述触发策略,那么如果厂商2也采用触发策略,则他的每期 得益是, *=(6-2q*)q*,无限次重复博弈得益的现在值为 */(1 )= (6-2q*)q* /(1- )。如果厂商2在第一阶段偏离,并根据厂商1 的产量q*决定自己该阶段的最大利润产量,则该产量必满足:

  max (8 q2 q* 2)q2q2

  第四章   重复博弈Word31

  二、低水平合作解之得q2=(6-q*)/2,,相应的得益(即利润)为 d=(6-q*)2/4.

  但是,从第二阶段开始,因为厂商1必然报复性地采用古诺产量qc=2,因此厂商2也只能采用古诺产

  量2,从此得益永远为 c=4。 这样无限次重复博弈得益的现在值为(6 q * ) 4 d c 1 4 1

  (6 - 2q*)q * (6 q* ) 4 1 4 1 (3q * 6)[3(9 )q * 6(9 5 )] 0

  第四章   重复博弈Word32

  二、低水平合作时,厂商2才愿意也采用上述触发策略,否则肯定会偏离。由于q*2,因 此只有

  2(9 5 ) q* 9 时触发策略才是稳定的,也就是说,对于给定的 水平,它能够支持的具有 稳定性的最低“合作”产量q*满足

  2(9 5 ) q* 9

  第四章   重复博弈Word33

版权声明:此文档由查字典文档网用户提供,如用于商业用途请与作者联系,查字典文档网保持最终解释权!

下载文档

热门试卷

2016年四川省内江市中考化学试卷
广西钦州市高新区2017届高三11月月考政治试卷
浙江省湖州市2016-2017学年高一上学期期中考试政治试卷
浙江省湖州市2016-2017学年高二上学期期中考试政治试卷
辽宁省铁岭市协作体2017届高三上学期第三次联考政治试卷
广西钦州市钦州港区2016-2017学年高二11月月考政治试卷
广西钦州市钦州港区2017届高三11月月考政治试卷
广西钦州市钦州港区2016-2017学年高一11月月考政治试卷
广西钦州市高新区2016-2017学年高二11月月考政治试卷
广西钦州市高新区2016-2017学年高一11月月考政治试卷
山东省滨州市三校2017届第一学期阶段测试初三英语试题
四川省成都七中2017届高三一诊模拟考试文科综合试卷
2017届普通高等学校招生全国统一考试模拟试题(附答案)
重庆市永川中学高2017级上期12月月考语文试题
江西宜春三中2017届高三第一学期第二次月考文科综合试题
内蒙古赤峰二中2017届高三上学期第三次月考英语试题
2017年六年级(上)数学期末考试卷
2017人教版小学英语三年级上期末笔试题
江苏省常州西藏民族中学2016-2017学年九年级思想品德第一学期第二次阶段测试试卷
重庆市九龙坡区七校2016-2017学年上期八年级素质测查(二)语文学科试题卷
江苏省无锡市钱桥中学2016年12月八年级语文阶段性测试卷
江苏省无锡市钱桥中学2016-2017学年七年级英语12月阶段检测试卷
山东省邹城市第八中学2016-2017学年八年级12月物理第4章试题(无答案)
【人教版】河北省2015-2016学年度九年级上期末语文试题卷(附答案)
四川省简阳市阳安中学2016年12月高二月考英语试卷
四川省成都龙泉中学高三上学期2016年12月月考试题文科综合能力测试
安徽省滁州中学2016—2017学年度第一学期12月月考​高三英语试卷
山东省武城县第二中学2016.12高一年级上学期第二次月考历史试题(必修一第四、五单元)
福建省四地六校联考2016-2017学年上学期第三次月考高三化学试卷
甘肃省武威第二十三中学2016—2017学年度八年级第一学期12月月考生物试卷

网友关注

董进宇:一位父亲的智慧:在应试的土壤里培养优秀的儿子
董进宇:千万别在这些时间里,批评孩子,切记!!
董进宇:最好的教育是给孩子一个充满爱的家庭
董进宇:在孩子面前请尽量少玩手机
董进宇:学会拒绝孩子,要善于跟孩子说NO
董进宇:父母你有告诉孩子这些真相吗
董进宇:高考状元学习的十种经验总结
董进宇:孩子的爱,要微笑着接纳
董进宇:代替孩子成长,每个现代家长的通病!
董进宇:做到这四点,你对孩子才是真爱 !!
董进宇:家庭氛围和孩子的性格,决定孩子的命运!
董进宇:“教”孩子可能就是一种剥夺
董进宇:孩子在小学里最重要的5件事
董进宇:父母教育孩子你做到口径一致了吗
董进宇:总在孩子面前玩手机,离一个失败的父母就不远啦
董进宇:中国式母爱还真可怕
董进宇:妈妈一定要为孩子做的六件事
董进宇:“问题孩子”是“问题家庭”的代言人
董进宇:新生入园,家长十三忌,幼儿园必须让家长知道
董进宇:决定孩子成功最重要的因素是什么?为人父母的你知道吗?
董进宇:怎样指导孩子看电视
董进宇:哭闹是孩子成长必经的过程,家长不必太在意
董进宇:中学生喜欢什么样的父母
师德师风学习资料
董进宇:做到“六先”,与孩子顺畅沟通
董进宇:女儿为嫁流氓不认父母,多年后才懂:踮起脚尖爱你的,只有父母……
董进宇:母亲的爱让他从“坏小子”到总统
董进宇:教育,只有在自由下才可能发生
董进宇:别把发泄情绪当成教育,孩子不是情绪垃圾桶,犯错应量错定罚
董进宇:孩子不爱读书,家长怎么办?

网友关注视频

19 爱护鸟类_第一课时(二等奖)(桂美版二年级下册)_T502436
冀教版小学英语五年级下册lesson2教学视频(2)
8 随形想象_第一课时(二等奖)(沪教版二年级上册)_T3786594
【部编】人教版语文七年级下册《过松源晨炊漆公店(其五)》优质课教学视频+PPT课件+教案,辽宁省
每天日常投篮练习第一天森哥打卡上脚 Nike PG 2 如何调整运球跳投手感?
六年级英语下册上海牛津版教材讲解 U1单词
沪教版牛津小学英语(深圳用)五年级下册 Unit 1
沪教版八年级下册数学练习册一次函数复习题B组(P11)
北师大版数学 四年级下册 第三单元 第二节 小数点搬家
【部编】人教版语文七年级下册《逢入京使》优质课教学视频+PPT课件+教案,安徽省
第五单元 民族艺术的瑰宝_15. 多姿多彩的民族服饰_第二课时(市一等奖)(岭南版六年级上册)_T129830
冀教版小学数学二年级下册第二周第2课时《我们的测量》宝丰街小学庞志荣.mp4
苏科版数学七年级下册7.2《探索平行线的性质》
外研版英语七年级下册module1unit3名词性物主代词讲解
沪教版牛津小学英语(深圳用) 六年级下册 Unit 7
冀教版英语四年级下册第二课
河南省名校课堂七年级下册英语第一课(2020年2月10日)
【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,广东省
沪教版牛津小学英语(深圳用) 四年级下册 Unit 8
外研版英语三起5年级下册(14版)Module3 Unit1
化学九年级下册全册同步 人教版 第25集 生活中常见的盐(二)
沪教版牛津小学英语(深圳用) 五年级下册 Unit 10
外研版英语三起6年级下册(14版)Module3 Unit2
七年级英语下册 上海牛津版 Unit9
北师大版八年级物理下册 第六章 常见的光学仪器(二)探究凸透镜成像的规律
三年级英语单词记忆下册(沪教版)第一二单元复习
冀教版小学数学二年级下册第二单元《有余数除法的整理与复习》
人教版二年级下册数学
【部编】人教版语文七年级下册《泊秦淮》优质课教学视频+PPT课件+教案,天津市
沪教版牛津小学英语(深圳用) 五年级下册 Unit 7