电大博弈与决策形成性考核册答案

电大博弈与决策形成性考核册答案

06-29 电大作业

以下是为您推荐的《电大博弈与决策形成性考核册答案》,希望能对您的工作、学习、生活有帮助,欢迎阅读参考!

 

 

 

 

因部分图片无法显示,完整答案请下载文末附件


博弈与决策
一、名词解释
1.博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科。
2.完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。
3.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道先采取行动的人采取的是什么行动。
4.动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。
5.非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行动的话,这种博弈类型就是非合作博弈。
6.纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的这个战略能使其期望效用最大化。
7.纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变自己的策略,这个策略就是纯策略。
8.纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改变自己的策略,否则会使策略组合令人后悔或者不满意。



答:(1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行;
(2)对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列;
(3)余下的策略组合是(低价,低价),这就是该博弈的最优结果。
[注:步骤(1)(2)颠倒亦可]

 

答:(1)对员工乙而言,策略R是明显劣势策略,用竖线划去“R”所对应的列;
(2)对员工甲而言,在员工乙剔除R策略之后,C策略是劣势策略,用横线划去“C”所对应的行;
(3)对员工乙而言,此时劣势的策略是L,用竖线划去“L”所对应的列;
(4)对员工甲而言,此时劣势的策略是D,用竖线划去“D”所对应的行;
(5)余下的策略组合是(U,M),这就是该博弈的最优结果。
三、根据优势策略下划线法找出以下博弈的纯策略纳什均衡,并指出是否存在混合策略纳什均衡。
要求: (1)划出相应优势策略的下划线;(2)给出最优的博弈结果。

 

答:(1)下划线如图所示;
   (2)没有形成一个纯策略纳什均衡。
    (3)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。
[注:括号的数字和字母顺序不能颠倒]
2号厂商
W X Y
1号厂商 A 3
7 2
0 5
4
B 6
8 2
2 5
0

答:(1)下划线如图所示;
   (2)形成两个纯策略纳什均衡,即(A,Y)和(B,W)。
(3)博弈的结果有两个:(4,5),即1号厂商获得4单位支付,2号厂商获得5单位支付;(8,6),即1号厂商获得8单位支付,2号厂商获得6单位支付。
(4)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。
[注:括号的数字和字母顺序不能颠倒]
四、在以下博弈矩阵图中找出哪一个是囚徒困境博弈,并简要解释理由。

坏心 好心
甲 坏心 12
10 2
50
好心 60
12 39
100

                                                  图1-1


坏心 好心
甲 坏心 12
10 0
110
好心 50
0 39
100

                                                  图1-2


坏心 好心
甲 坏心 20
10 0
30
好心 30
0 12
11

                                                  图1-3
答:(1)利用下划线法找出博弈的纳什均衡,如图所示。
(2)囚徒困境反映的是基于个人理性的个体最佳选择并非集体最佳选择,参与者之间会选择相互“坏心”,而且对双方而言,(好心,好心)的结果一定要比(坏心,坏心)更好。
(3)在三个博弈中,图1-1不是囚徒困境博弈,因为参与者甲在选择“好心”(即合作)策略时才能实现均衡。图1-2所示的博弈为囚徒困境博弈,因为参与者只有在都选择“坏心”(即不合作)策略时才能实现均衡。图1-32所示的博弈也不是囚徒困境博弈,因为对乙而言,(坏心,坏心)的结果比(好心,好心)的结果有利。
五、博弈分析
假设你所在的公司现在的发展虽然还可以,但是未来前景不容乐观,所以老板只能对一个人加薪。如果你和你的同事之间只有一个人提出来加薪的请求,老板会考虑为提出要求的这个员工加薪,当然不会对那个没有提出来的员工加薪了。但是假如你和你的同事两个人一起提出来要加薪,那么老板就只有选择同时辞退你们俩。
请给出这个博弈的矩阵分析图,并解释你最优的策略。
答:该博弈矩阵如下:
同事
要求 不要求
你 要求 被辞退
被辞退 无影响
加薪
不要求 加薪
无影响 无影响
无影响
根据下划线方法,在这个博弈中,我们可以找到两个纳什均衡,即(要求,不要求)和(不要求,要求)。这个结果说明,你和同事只能一方提出加薪的要求才可以,同时选择要求加薪的行动只会带来最坏的结果——都被辞退。
换句话说,你要想获得福利的改进,就应该先行一步提出来加薪的要求。而假如你看到你的同事首先选择了要求加薪的策略之后,你最好不再提出来这样的要求。
平时作业讲评(2)
一、名词解释
1.不确定性:就是指经济行为者在事先不能准确地知道自己的某种决策的结果,或者说,只要经济行为主体的一种决策的可能结果不止一种,就会产生不确定性。
2.最大期望收益法:就是在事件结果不确定的情况下,应该选择给他带来“期望收益”最大的策略。
3.混合策略:如果在每个给定信息下,参与者只能以某种概率选择不同地策略,就称为混合策略。
4.支付均等法:当一个参与者在均衡中应用一个混合策略时,他所得到的支付必须与他在混合策略中所应用的每一个纯策略的支付相同。
5.子博弈:如果从第一阶段以外的某个阶段开始的后续博弈阶段,也有初始信息集,具备进行博弈所需要的各种信息,能够自成一个博弈,我们就将这个博弈阶段称为原动态博弈的一个“子博弈”。
6.逆向归纳法:从最后一个阶段或最后一个子博弈开始逆推上去,逐步向前倒推以求解动态博弈均衡,这就是逆向归纳法。
7.承诺:就是对愿意与你合作的人给予回报的方式。
8.空洞威胁:当发出威胁的博弈参与者选择威胁所宣称的行动策略时,对自己并没有好处,这就不可信了,这叫做“空洞威胁”。
二、请用最大期望收益法寻找最优策略。
要求: (1)写出计算步骤;(2)给出最优的策略结果。
甲乙两家企业,为了市场份额的争夺,在价格定制问题上各有两种纯策略,如图2-1所示。两家企业都知道自己在各个策略组合下的收益情况,但是并不知道对方的收益。假设甲采取U的概率为0.3,乙采取R的概率为0.6。

L R
甲 U 1
2 4
3
D 4
4 2
1

 答:(1)当乙采取R策略的可能性为0.6时,采取L策略的可能性为0.4,那么甲据此判断采取自己的策略U时所获得的可能的期望收益EU(U)=0.6×2+0.4×3=2.4。甲采取自己的策略D时所获得的可能的期望收益EU(D)=0.6×4+0.4×1=2.8。很显然,甲应该选择策略D,因为EU(D)> EU(U)。
(2)当甲采取U策略的可能性为0.3时,采取D策略的可能性为0.7,那么乙据此判断采取自己的策略L时所获得的可能的期望收益EU(L)=0.3×1+0.7×4=3.1。乙采取自己的策略R时所获得的可能的期望收益EU(R)=0.3×4+0.7×2=2.6。很显然,乙应该选择策略L,因为EU(L)> EU(R)。
(3)最终该博弈的结果就是(D,L),均衡的支付为(4,4)。
三、求解以下博弈的所有纳什均衡。
要求: (1)写出计算步骤;(2)给出所有纳什均衡策略。
曹操
华容道 其它路
关羽 华容道 -2
2 3
-2
其它路 1
-2 -1
2

答:(1)对该博弈矩阵利用下划线法,发现没有纯策略纳什均衡。
(2)假设关羽选择华容道的概率为p,选择另外一条道的概率为1-p;也假设曹操选择华容道的概率为q,选择另外一条道的概率为1-q。
根据支付均等法:
对关羽而言,U华容道= U其他路,即2•q+(-2)•(1-q)= (-2)•q+2•(1-q),可以得到q=1/2。
对于曹操而言,V华容道= V其他路,即(-2)•p+1•(1-p)=3•p+(-1)•(1-p),可以得到p=2/7。
该博弈的混合纳什均衡为(2/7,1/2)。
2号厂商
X Y
1号厂商 A 10
10 4
1
B 1
4 5
5

答:(1)对该博弈矩阵利用下划线法,发现有两个纯策略纳什均衡(A,X)和(B,Y)。
(2)假设1号厂商选择A的概率为p,选择B的概率为1-p;也假设2号厂商选择X的概率为q,选择Y的概率为1-q。
根据支付均等法:
对1号厂商而言,UA= UB,即10•q+1•(1-q)=4•q+5•(1-q),可以得到q=2/5。
对2号厂商而言,VX= VY,即10•p+1•(1-p)=4•p+5•(1-p),可以得到p=2/5。
该博弈的混合纳什均衡为(2/5,2/5)。
四、请用逆向归纳法分析以下博弈的可能结果。









答:(1)逆向归纳法画图如图所示。
  (2)可能的均衡路径为A—U,1号参与者选A,2号参与者选U,结果为(20,20),双方各得到20单位的报酬。
(3)C—Y路径上的报酬(1000,1000)远大于A—U路径上的(20,20),但是并不能成为均衡。因为如果1号参与者选择了C,2号参与者选择Z就可以获得做大的报酬,并使1号只能获得0单位报酬。1号参与者并不能保证2号参与者会选择Z,而且2号即使有这种保证也是不可信的。
五、寻找可信的威胁。
假如有两个博弈参与者,2号威胁1号说,假如1号参与者对他使坏心,他就会对1号参与者也使坏心。那么在以下哪些博弈图中,1号会相信2号的威胁?






          图2-1                                        图2-2






图2-3



答:(1)对三个博弈图利用逆向归纳法分析,如图所示。
(2)只有当坏心比好心对2号参与者更有利时,2号所提出的威胁才可信。
(3)在图2-1和2-2中的威胁才可信。因为如果1号选择坏心的话,2号选择坏心才是最优的,所以威胁可信。
(4)在图2-3中,2号所提出的威胁不可信。因为如果1号选择坏心的话,2号选择好心才是最优的,不会选择坏心的。
六、博弈分析
1.假设你是公司的管理者,某天有位员工向你提出加薪的要求,但是你既不舍得他辞职,也暂时不想给他加薪,那么你该如何巧妙地回绝呢?
答:你应该告诉他,加薪这事不属于你管,有专门的部门或其他领导负责。所以,你对此无能为力,因为你对此事没有决定权。而一旦知道自己要和这样的人力资源部门去博弈了,这位员工的立场就会发生变化,也许就会软化下来。  
2.(1)如果一个男孩子给女孩发短信说:“亲爱的,你知道我爱你爱得很深,我愿意为你赴汤蹈火,我每天每时每刻都很想见到你,什么艰难险阻也不能阻止我向你靠近。周五下班的时候,如果不下雨,我就一定过去找你!”。(2)有一位父亲对自己很淘气的儿子说“你再不听话,我就拧掉你的耳朵!”请你分析一下这两个场景中的“承诺”和“威胁”是否值得信赖。
答:(1)中的男孩对女孩的“承诺”是不可信的,因为“下雨”是一件成本很小的事,但是男孩却因此不能去做他所说的“每天每时每刻都很想见到你,什么艰难险阻也不能阻止我向你靠近”。所以,廉价的承诺是不可置信的。
(2)中的父亲的“威胁”是不可置信的“空洞威胁”。因为拧掉儿子的耳朵对他并没有任何好处,还会因此带来更大的负担,也影响了孩子的一生,父亲也要为此背负一辈子的心理成本和经济成本。对孩子而言,这也是一生的不良影响和沉重的心理负担,以及巨大的机会成本。显然这个威胁这对整个家庭没有任何好处。所以,这个威胁根本不可置信。
平时作业讲评(3)
一、名词解释
1.网络外部性:如果一种产品对消费者的价值会随着其他使用者数量增加而增加,这种产品就具有网络外部性。
2.大规模协调博弈:源于网络外部性,假如有成千上万的人在同时进行一次性博弈,那就形成了大规模协调博弈。
3.重复博弈:指同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”。
4.无名氏定理:只要博弈参与者具有足够的耐心,那么在满足博弈参与者个人理性约束的前提下,博弈参与者之间就总有多种可能达成合作均衡。
5.针锋相对策略:如果博弈参与者第一步采取合作,此后每一步都重复对方上一步的行动,要么是合作要么是背叛,只要是博弈没有确定的期限,由于长期利益对短期行为的制约作用,因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的,那么就会形成一种持续合作的态势。
6.冷酷策略:是指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。
7.双边博弈:在某些博弈中,每个博弈者的策略组合都相同,博弈者之间的支付或收益对称,这种博弈被称之为双边博弈。
8.演化稳定策略:说的是,如果均衡一旦得以形成,此后偏离均衡的运动就会受到自然选择的打击。
二、请分析以下重复博弈的合作与背叛问题。
1.图3-1和3-2的两个囚徒困境博弈会一直重复下去,而且没有确切的截止日期,请问哪个博弈的参与者更有可能出卖对方?为什么?

好心 坏心
甲 好心 20
20 40
0
坏心 0
40 5
5
              图3-1

好心 坏心
甲 好心 20
20 22
0
坏心 0
22 5
5
          图3-2
答:图3-1所示的囚徒困境博弈的参与者更容易背叛对方。
这图3-1和图3-2的两个博弈中,双方都使用好心时,各自获得20个单位的支付。一个参与人在对方好心而自己使坏心时获得的支付是不一样的,图3-1为40个单位,远大于好心时的20个单位;图3-2 为22个单位,仅稍大于好心时的20个单位。所以,图3-1中的参与者更容易背叛对方。
2.图3-3和3-4的两个囚徒困境博弈会一直重复下去,而且没有确切的截止日期,请问哪个博弈的参与者更有可能出卖对方?为什么?

好心 坏心
甲 好心 20
20 40
0
坏心 0
40 18
18
              图3-3

好心 坏心
甲 好心 20
20 40
0
坏心 0
40 15
15
          图3-4
答:图3-3所示的囚徒困境博弈的参与者更容易背叛对方。
这图3-3和图3-4的两个博弈中,双方都使用好心时,各自获得20个单位的支付;一个参与人在对方好心而自己使坏心时获得的支付为40单位。在图3-3中,即使对方也使用了坏心,双方也还各自获得18个单位支付,与都好心时相差2个单位;而在图3-4中则降低为15个单位,与都好心时相差了5个单位,背叛要付出比较高的代价。所以,图3-3中的参与者更容易背叛对方。
三、分析以下博弈的结果及策略。
要求: (1)给出可能的博弈均衡;(2)写出应采取的行动策略。
1.假设你是一位非常出众的男士,有一位热恋的女朋友,她各方面则比较普通。今天晚上在洋河体育场有一场足球比赛,你想去看足球比赛。而此时,在奥体中心也有一场王菲的演唱会,你的女朋友想去听演唱会。博弈矩阵如下,请:(1)分析该博弈的均衡;(2)面对着冲突,你有哪些行动可以选择?
女方
足球赛 演唱会
男方 足球赛           1
2          0
0
演唱会          -1
-1          2
1
答:(1)根据下划线法,如图所示,博弈均衡为(足球赛,足球赛)或者(演唱会,演唱会),即二人要么都去看球赛,要么都去听演唱会。
(2)你可以选择:一是主动告诉女方,愿意陪她去听演唱会;二是主动告诉她,你很想去看足球赛,希望她可以陪你去看;三是自己先发制人地买好两张足球赛的票,告诉女方你已经买了票;四是利用你自身的优势,告诉她要是不陪你去,有其他人愿意陪你去。
2.你和你的朋友分别经营着一家企业,你们二人可以考虑合作,也可以不合作。当然,基于产品和市场的预期不同,现在有两种情形出现,分别的博弈矩阵如图3-5和3-6所示。请你分析:(1)两种情形分别属于什么博弈?(2)给出博弈的均衡结果。

合作 不合作
甲 合作          10
10          4
0
不合作          0
4           4     
4
             图3-5

合作 不合作
甲 合作          10
10          12
0
不合作          0
12           4     
4
             图3-6
答:(1)图3-5属于合作博弈,是猎鹿博弈。有两个纯策略纳什均衡,即(合作,合作)和(不合作,不合作)。如果对方愿意开展合作,甲和乙的最优行动选择就是选择合作,从而各自获取10个单位的支付。
(2)图3-6属于不合作博弈,是囚徒困境博弈。有一个纯策略纳什均衡,即(不合作,不合作)。由于个人理性的存在,甲乙双方只有选择不合作,从而各自获得4个单位的支付。
四、请解释以下问题。
1. Windows操作系统与大规模协调博弈以及网络外部性有什么关系?
答:Windows操作系统的使用具有网络外部性,使用该系统的人越多,这个系统的价值就会变得越高。这样一来,使用者就要考虑使用哪种操作系统的普及率更高。假如有成千上万的人在同时进行一次性博弈,那就形成了大规模协调博弈。
2.如果你是一个理性的人,看到周围的朋友都逐渐拥有了QQ账号,你应该怎么做?为什么?
答:QQ这种即时通讯工具,具有很强的网络外部性,使用QQ的人越多,通过QQ形成的交际网络就变得越大,其网络价值就越高了。而如果你周围使用QQ进行聊天交流的人越多,你拥有的QQ账号所起的作用就越大。所以,你应该也申请一个QQ账号。
3.微软公司为什么在一定程度上默认盗版的泛滥?
答:微软公司在一定程度上默许了盗版的泛滥,实际上就是让自己的产品在市场上逐步深入,得到了更多的使用客户,从而让新使用者首先想到的就是要配备安装微软公司的Windows系列操作系统,从而充分发挥其产品的网络外部性。正是盗版帮助了微软公司在中国的发展,没有盗版就没有微软如今在中国市场上的垄断地位。
五、博弈分析
假设你是一家上市公司的董事长,可以选择如实披露财务数据或向投资者说谎也就是发布虚假的信息,投资者可以选择投资或不投资。博弈矩阵如下。请分析该博弈的均衡策略,你们公司该怎么做?为什么?
投资者
投资 不投资
上市公司 如实披露          5
5          0
0
虚假披露          -5
10          0
0
答:如果这是一个单期博弈的话,其纳什均衡只有一个(虚假披露,不投资),即上市公司选择披露虚假财务信息,投资者选择不投资,双方的博弈支付均为0。
如果是多期重复博弈的话,情况就不一样了,只要在没有明确截止期限的情况下,就可以实现(如实披露,投资)这个博弈结果。但是,一旦企业披露的信息有误,有虚假的成分,那么投资者就不会再相信这个上市公司,就在接下来的博弈中选择不投资。
所以,上市公司要想和投资者达成合作,就必须向外部的投资者树立一种较强的正面的声誉,不能披露任何虚假的信息,并致力于长期维护这个声誉,从而保证合作得以持续,(如实披露,投资)这个结果才会出现。

平时作业讲评(4)
一、名词解释
1.英式拍卖:也称为公开拍卖或者增价拍卖,买者自由地相继出价,且出价是逐步提高的,直到没有人愿意支付更高的价格为止。
2.第二价格密封拍卖:每个竞标者分别向拍卖方提交自己的报价,而且他们不知道别人的出价,出价最高的竞标者将获得物品,并按所有的出价中仅次于最高出价的第二高价格支付给卖家。
3.私人价值拍卖:在这类拍卖中,拍品对不同竞标者的价值可能并非是独立的,每个竞标者都确切地知道该拍品对他本人的价值,但是却不能从其他竞标者的估价中得到对自己的估价任何有用的信息。
4.边缘政策博弈:是一种将博弈参与者和其他对手置于灾难发生的可能性逐步增大的风险中的一种战略,但是可怕的灾难结果实际上发生与否并不全在发出威胁一方的控制之中。
5.信号显示:具有信息优势的一方(拥有私人信息的一方)采取某种行动向信息劣势一方(不了解对方私人信息的一方)发送相关信号,来告诉对方自己的真实类型,这就是信号显示。
6.信号筛选:是在博弈中没有私人信息的一方为了减弱非对称信息对自己的不利影响,以便能够区别不同类型的交易对象而提出的一种交易方式。
7.道德风险:就是从事经济活动的代理人在最大限度地增进自身效用的同时做出不利于委托人的行动。
8.激励相容约束:委托人提供一个合约,让代理人在努力工作时所获得的收益大于不努力工作时的收益,这就是激励相容约束。
二、请分析以下问题。
1.小张有一件古董,他认为值 30000元。小李想买这件古董,他认为值50000元。在二人不知道协商如何进行的情况下,请你分析一下可能的结果。
答:小张和小李双方可能在30000元至50000元之间的价格上成交。
2.在上面一个问题的基础上,小王也想买这件古董,也愿意出价50000元来买。在不知道协商如何进行的情况下,而且小李和小王不会串通起来,请你分析一下可能的结果。
答:小张应该以50000元的价格卖给小李或者小王,而没有其他结果。因为他们二人都认为该件物品值50000元,那么低于50000元的出价是不稳定的。
3.假设有一片果园要对公众拍卖,采用英国式拍卖的方式。这片果园的真实价值大概为30万元,但是这个信息不能有效地被竞拍者所获取。一共有五个人参与竞拍,甲的预期价值是30万,乙的预期价值是37万,丙的预期价值是49万,丁的预期价值是27万,小刘的预期价值是53万。请问:(1)小刘应该报出的多少竞拍价格是多少?(2)他获得的预期支付是多少?(3)获得的实际价值是多少?(4)这种情况属于什么问题?
答:(1)小刘应该报价53万。
(2)他获得的预期支付为4万元,即53-49=4万元。
(3)他获得的实际价值为-19万元,即30-49=-19万元。
(4)这种情况就是“赢者诅咒”。
4.你想买一辆二手车,但是无法判断它的价值。你自己觉得这辆车子的质量优良或者不值得买的概率各占一半,但是汽车的质量只有卖方才知道。下面列出了汽车对你和卖方的价值。

汽车质量 对你的价值 对卖方的价值
好 100000元 60000元
差 10000元 0

请问在这个博弈中,你是否愿意买车?为什么?
答:不愿意买车。
由于无法判断旧车的价值,而且质量优良或者不值得买的概率各占一半,你只愿意出价(100000+10000)/2=55000元,那么卖方就不会提供质量好的车子给你,而让质量好的车子退出市场。而你如果出价60000元以上,你也只有一半的机会能买到高质量的车子,还有一半的机会买到质量低劣的车子。所以,你也不愿意花60000元以上来买平均质量只有55000的车子。
三、请解释以下问题。
1.一些高级会所为什么采用会员制?
答:由于信息不对称,一些高级会所并不清楚消费者属于哪种类型的,而会员制则是一种信号显示和信息甄别的组织形式,其筛选机制能有效地显示会员信息,能有效地进行身份甄别,从而降低信息不对称所引起的交易成本,提高交易效率。
3.你在搬家后想找一位新牙医,但你可能只想找至少好几月内都排不出时间的牙医,为什么?
答:你最想找的牙医应该是能满足你的需求并能不断吸引新客户、保住回头客户的医生,而要约这种牙医为你治病需要等待很长的时间。但是那些客源迅速流失的水平糟糕的牙医则会有很多空闲的时间。也就是说,那种你一预约就可以安排时间给你治疗的牙医可能就是你最不想要的医生。
3.医学科技发展了,为什么人工流产率反而上升了?
答:随着医学科技的发展,各种新型的避孕工具和药物以及人工流产技术让人们放松了道德层面的约束,降低了意外怀孕的担心,让人们性生活的意外成本大大地降低。所以,人们在性生活时就会倾向于冒险,比如在性生活中倾向于不采取任何保护措施,事后可以吃紧急避孕药,实在不行的话,大不了就是进行人工流产。因此,现代医学医药技术的发展,助长了对性生活的冒险,也就提高了意外怀孕的机会,拉升了人工流产率。
4.作为企业老板,你会为全部员工配股还是仅为高层管理者配股?
答:持股计划对高层管理者有效,是因为高层管理者人员少,每个经理人可以获得的股份就比较大,而他们对于公司的盈亏有着重要影响,足以激励其他们努力地为公司工作。持股计划对普通员工低效或无效,是因为普通员工人员众多,难以避免地出现搭便车问题。所以,应该对高层管理者配股,不应该为全部员工配股。
5.一些日本企业在招聘员工时,那些字迹潦草的应聘者可能被优先录用,你觉得是为什么?
答:这是一个信号博弈。站在信号博弈的角度看,接受普通教育的人往往炫耀他们刻意写得工工整整的字迹,但受过良好教育的人却常常字迹潦草难以辨认。另外,字迹端正工整的人做事严谨刻板,缺乏进取心;而进取心强,创造性高的人对字迹往往不讲究,比较适合企业管理和产品开发工作。
四、博弈分析
1.如果你是一家公司的老总,鉴于近期公司的效益明显下滑,人事部经理向你提出了降低人力资源成本的方案择:一是裁掉20%的现有员工;二是全员降薪20%。你应该如何决定呢?为什么?
答:应该选择裁掉20%的现有员工。如果选择全员降薪20%,那些业务能力很强的员工就会另觅新的东家,得到一份收入持平甚至更好的工作,而你其实更希望这些有能力的员工留下来。如果你选择裁员20%,那肯定是根据以往的业绩表现而做出的裁员名单,就可以确保将那些工作能力不佳的员工裁掉,这样会让你的队伍更加健康、更加有活力。
2.假如你是一位风险投资家,而我正好在为自己的一个项目寻求投资,我向你提出来,希望你能够为我投资2000万,我把新创公司80%的股权给你。而你认为必须让我自己出资50万元,你只拥有新创公司的50%的股份。这是为什么呢?
答:对于风险投资家和企业家而言,他们的立场和出发点完全不同。作为创业者,肯定希望得到投资,但是又不希望受到很大的约束,希望可以规避掉自己可能的损失。作为投资资本家,肯定希望项目能够成功,也只有成功才可以从中获得投资回报,那么就必须想办法让企业家努力工作。风险投资家让企业家自己也出资一部分,才能有效激励企业家努力工作。

《博弈与决策》期末复习指导
期末复习资料
第一章博弈论的基本理论
(一)博弈论的基本概念
博弈:现实生活中,不同的决策人为了争夺资源、争夺机会使得决策人处于相互依存的复杂关系中,这就不得不思考他人有针对性行为对自身所产生的影响。
博弈就是一种游戏,在这种状态下,参与者必须作出选择,并对对方的选择作出判断,这种判断和选择决定了博弈的结果。每个对弈者在决定采取何种行动时不但要根据自身的利益和目的行事,也要考虑自身的决策行为对其他人的可能影响,以及其他人的行为对自身的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。
博弈论:就是以参与人之间有针对性的行为产生的互动过程为研究对象的理论,探讨在互动过程中参与人的一般行为规律。博弈论的核心问题在于如何在“策略互动”的局势中找到局中人的最佳行为方式,使得采用最佳行为方式的局中人能获得最大的收益。所以博弈论可以简单理解尾研究策略互动局势中的局中人的理性行为的理论。
(二)博弈论的构成要素
1、博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略、得益、结果、均衡等。 
2、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体);
3、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策; 
4、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排;
5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西;
6、均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。
上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博弈规则来决定均衡。

二、博弈论的发展简史
1、萌芽阶段:博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
2、产生阶段:1944年科学家冯•诺伊曼和经济学家奥斯卡•摩根斯坦合著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,标志着博弈论作为一门独立的的学科诞生。
3、发展阶段:1950年,约翰•纳什(John Nash)引入均衡(解)的概念,即纳什均衡,将博弈论从零和博弈推进到非零和博弈(即参与人会出现双赢或双输的情况),纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。纳什获得1994年诺贝尔经济学奖。
4、高潮阶段:20世纪40年代末到50年代中期是博弈论研究的第一个高潮时期,一方面是合作博弈发展到了鼎盛时期,包括纳什和夏普里的“讨价还价”模型,“核”的概念。另一 方面非合作博弈开始创立,纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)以及Tucker于1950年定义的“囚徒困境”。这一时期海提出了“微分博弈”,奥曼提出了“强均衡”概念,“重复博弈”也开始研究。
1965年和1975年兰哈德•泽尔藤(Reinhard Selten)把纳什均衡推广到动态博弈,并提出子博弈完美纳什均衡;1967-1968年间,约翰•海萨尼(John Harsanyi)把纳什思想推广到不完全信息模型,提出贝叶斯均衡;他们与纳什一起分享1994年诺贝尔经济学奖。1996年诺贝尔经济学奖获得者詹姆斯•莫里斯教授和威廉姆•维克瑞教授在20世纪60、70年代提示不对称信息对交易带来的影响,并提出相应对策。70年代的重要事件海包括“进化博弈论”,“进化稳定策略”,此外“共同知识”也 引起了广泛关注。
5、成熟阶段:80、90年代是博弈论于驻留经济学融合时期,也是博弈论走向成熟时期。这个时期最重要的进展包括Elon KohlbergZAI 1981年引入“前向归纳法”,克里普斯和威尔逊在982年提出“序列均衡”,斯密1982年出版《进化和博弈论》,海萨尼和泽尔藤在988年提出有关非合作博弈中均衡选择的一般理论和标准。1991年佛德伯格和泰勒提出了“精练贝叶斯均衡”。
三、博弈论的分类
1、参与人行动的先后顺序:静态和动态
静态博弈是指参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。
动态博弈:参与者的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人所采取的行动。
2、参与人对其他参与人的了解程度:完全信息和不完全信息
完全信息博弈:参与者对所有参与者的特征、策略空间及策略组合下的支付有充分了解称为完全信息;
不完全信息博弈:参与者对所有参与者的特征、策略空间及策略组合下的支付的信息了解得不够准确或者不是对所有参与者的特征、策略空间及策略组合下的支付的信息都有准确的了解。
3、参与人之间是否进行合作:合作和非合作
合作性博弈:参与者从自己的利益出发与其他参与者谈判达成协议或形成联盟,其结果对联盟方均有利;参与人在协议范围内进行博弈。
非合作性博弈:参与者在行动选择时无法达成约束性的协议

4、非合作博弈四种类型及对应的均衡:
(1)完全信息静态——纳什均衡、占优均衡
纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。也就是说,所有人的战略都是最优的。
占优均衡指不论其他参与者做何种策略选择,每个参与者的最佳策略都是唯一的,其结果为占优均衡。当所有博弈者都有一个占优战略时,其结果将是占优均衡。占优均衡一定是纳什均衡。
(2)完全信息动态——子博弈精炼纳什均衡
子博弈精炼纳什均衡是泽尔腾(Selten)于1965年首先提出的,其目的是将那些不
可置信威胁策略的纳什均衡从均衡中剔除,从而给出动态博弈一个合理的均衡解。在动态博弈中,参与人的行动有先后顺序,后行动的参与人在自己行动之前就可以观察到先行动者(参与人)的行为,并在此基础上选择相应的策略。而且,由于先行动者拥有后行动者可能选择策略的完全信息,因而先行动者在选择自己的策略时,就可以预先考虑自己的选择对后行动者选择的影响,并采取相应的对策。
(3)不完全信息静态博弈——贝叶斯纳什均衡
贝叶斯纳什均衡:在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。给定其他参与人的战略选择,每个参与人的最优战略依赖于自己的类型。由于每个参与人仅知道其他参与人有关类型的分布概率,而不知道其真实类型,因而,他不可能知道其他参与人实际上会选择什么战略。但是,他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系。因此,该参与人的决策目标就是:在给定自己的类型,以及给定其他参与人的类型与战略选择之间关系的条件下,使得自己的期望效用最大化。贝叶斯纳什均衡是一种类型依赖型战略组合。
(4)不完全信息动态博弈——精炼贝叶斯纳什均衡
精炼贝叶斯纳什均衡:在不完全信息动态博弈中博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率。他只是对这一概率分布有自己的主观判断,即有自己的信念。博弈开始后,该参与人将根据他所观察到的其他参与人的行为,来修正自己的信念。并根据这种不断变化的信念,作出自己的战略选择。

第二章简单博弈与博弈均衡
(一)占优战略与占优战略均衡
占优战略是博弈论(game theory)中的专业术语,所谓的占优战略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略。
占优战略均衡必定是纳什均衡,因为局中人的占优战略是对所有其他局中人的任何战略组合情况下的最优战略选择,自然它也一定是对于所有其他局中人的某个特定战略(其他局中人的最优战略)情况下的最优战略选择。但反过来不成立,纳什均衡不一定是占优战略均衡。
(二)纳什战略均衡
1、纳什均衡的意义:
   纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,其重要影响可以概括为以下六个方面:
   (1)改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
(2)扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
(3)加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
(4)形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
(5)扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
(6)改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗•萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。
2、占优战略均衡和纳什均衡的联系与区别:
纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语。在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。也就是说,所有人的战略都是最优的。
占优战略是博弈论(game theory)中的专业术语,所谓的占优战略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略。
占优战略均衡必定是纳什均衡,因为局中人的占优战略是对所有其他局中人的任何战略组合情况下的最优战略选择,自然它也一定是对于所有其他局中人的某个特定战略(其他局中人的最优战略)情况下的最优战略选择。但反过来不成立,纳什均衡不一定是占优战略均衡。显然,占优战略均衡是重复剔除的占优战略均衡的一种特例

第三章 重复博弈与序列博弈
一、重复博弈 
重复博弈中的“针锋相对”策略博弈
重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题。重复博弈最好的策略十分简单,只要将一个原则贯穿始终,即“针锋相对”。这一策略的获胜有一个十分重要的条件,即博弈是无限次重复的。也就是说,对局者都预期这一博弈将永远持续下去而不会停止。如果对局的次数是有限的话,上述结论将不再有效。
二、序列博弈 
序列博弈是指对局者选择策略有时间先后的顺序,某些对局者可能率先采取行动。序列博弈也是一种动态博弈。在序列博弈中,先行者可能占据一定的有利地位,我们把它叫作先行者优势。在某些市场中,特别在涉及市场进入的竞争时,先行者优势对于企业的经营具有重要意义。



第四章博弈论在企业经济管理决策中的应用
一、“保证最低价格”的策略
重点掌握保证最低价格策略
条款内容:该条款规定,顾客在本商店购买这种商品一个月内,如果发现其他任何商店比本店更低价格出售同样的商品,本店将退还差价,并补偿差额的10%。对消费者来说,保证最低价格条款使你至少在一个月内不会因为商品降价而后悔你的购买,但这种条款无疑是企业之间竞争的一种手段。
假定推行保证最低价格条款的商店为商店A,它的竞争者为商店B。当商店A把某产品定为5000元并推行保证最低价格条款的时候,商店B应如何定价最为有利呢?如果商店B高于5000元,显然对其竞争不利,因为除非顾客不了解情况,否则他们将到商店A去购买该产品。如果商店的定价低于5000元,它能否因此而争取到更多的顾客呢?不能,因为商店A已经有了保证最低价格的条款。这样,对商店B来说,它的最优的定价策略就是与商店A制定同样的价格。
再如,如果你在该商店花5000元购买了一架尼康相机,一周后你在另一家商店发现那里只卖4500元,那么你就可以向该商店交涉,并获得550元的退款。
  对消费者来说,保证最低价格条款使你至少在一个月内不会因为商品降价而后悔你的购买,但这种条款无疑是企业之间竞争的一种手段。
证最低价格条款是一种承诺,由于法律的限制,商店在向消费者公布了这一条款之后是不能不实行的,因此它是绝对可信的。这一承诺隐含着商店A向商店B发出的不要降价竞争的威胁,并使这种威胁产生其预期的效果。

二、扩大生产能力策略
垄断者为阻止潜在进入者进入市场,垄断者可能对潜在进入者进行威胁。但垄断者的这种威胁是否能达到阻止进入的目的,取决于其承诺。所谓承诺,是指对局者所采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。那么,一种威胁在什么条件下会变得令人可信呢?一般是,只有当对局者在不实行这种威胁会遭受更大损失的时候。与承诺行动相比,空头威胁无法有效阻止市场进入的主要原因是,它是不需要任何成本的。发表声明是容易的,仅仅宣称将要作什么或者标榜自己是说一不二的人也都缺乏实质性的涵义。因此,只有当对局者采取了某种行动,而且这种行动需要较高的成本,才会使威胁变得可信。
三、限制进入定价策略
限制进入定价是指现有企业通过收取低于进入发生的价格的策略来防范进入。潜在进入者看到这一低价后,推测出进入后价格也会那么低甚至更低,因而进入该市场终将无利可图。
四、掠夺性定价策略
掠夺性定价是指将价格设定为低于成本,而期望由此发生的损失在新进入企业或者竞争对手被逐出市场后,掠夺企业能够行使市场权力时可能得到补偿。这也是一种价格报复策略。掠夺性定价与限制定价之间的差异在于,限制定价是针对那些尚未进入市场的企业,是想较长一段时间内维持低价来限制新企业的进入。而掠夺性定价则将矛头指向已经进入的企业或即将来临之际。    






案例分析
囚徒困境
案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。
分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白;
假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B的唯一的选择也是坦白。
所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。
其支付矩阵如下:







性格大战

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。
分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。
在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。








价格战
案例:假设市场中仅有A、B两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下:









分析:无论对企业A还是企业B来说,低价都是他们的占优战略。从表可见,企业A的占优战略是10元,因为无论B采取什么战略,企业A都能获取比定价15元更多的利润。
如果企业B定价10元,企业A定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B定价15元,企业A定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B的占优战略也是定价10元的策略。
如果企业A定价10元,企业B定价10元能够获利100万元,而定价15元只能获得50万元;如果企业A定价15元,企业A定价10元可获利180万元,而定价15元却只能获利150万元。同样地,企业A的占优战略也是定价10元的策略。
最后有一个最容易出现的结局就是(10,10),故双方均采取低价策略。


标签:

粤ICP备2020078845号-2

中文范本网

Top