本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 4 ?! G0 b8 A- q$ s
/ J7 o: h' d# q3 r
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ `5 R. S: Y0 n2 c% j 以下三个定义:
8 [, b/ Z, Z( j) z 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
9 B/ c3 f$ |) g 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . `) O/ a) k8 Z, u- e4 S
所谓的双方优势策略则是指双方利益总和最大的策略。 . g$ r& V7 O' o5 J/ I
[编辑本段]严格优势策略举例分析
* Z& K7 X' q+ m' A/ {5 | 一、经典的囚徒困境 ' r0 T9 V9 L" g; p1 { i5 ~
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: - b! ?9 R: Y; I
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: / `* f( n1 l- W8 x- X: z6 f9 {, v- D
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 z7 k$ p1 b6 i6 m- E
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & Z8 G' c& r# B1 D/ B
若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ \# A. f0 l/ H! Z 9 J2 N4 W E3 R% t' t) R8 |
用表格概述如下:
' Q3 j& H# K" P! o( s4 p2 a1 G
+ |6 G s+ D% z( b 甲沉默(合作) 甲认罪(背叛)
o. ~6 g8 m: m乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 n' T" Y! v$ _- Z乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
1 f7 K \& x# o. k4 g8 j: T2 e, f5 u5 g% G
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 : w/ P" L; H- q5 \; T! D$ D
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( {! e+ ]- \; |1 K" g
若对方沉默、背叛会让我获释,所以会选择背叛。
, ~' f3 p; z7 {$ {/ e2 M1 w/ u/ b 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) p( c8 O2 @4 [( l: | 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 |8 I* |7 r+ M$ `- z8 I% x, [ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 e3 N0 ^; j8 Z+ W- D; ?. u
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ g c8 h$ j5 V5 U[编辑本段]二、智猪博弈理论; @& I1 g* ^6 z; r3 _ ?
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 N: u9 K8 v4 T! [) \- [
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 m# N. `) i$ y2 j 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' M! | A9 S1 R8 z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
" E) e% w# i& T+ A “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* b7 H) E+ O& \8 ? 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 K5 m& S* L" u# k2 l4 m 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. U0 ~0 Q% T: y0 d+ A! h1 }* M: r- R
# Z& j* K7 y6 k7 r/ o* G: J
三、关于企业价格策略
! w$ B7 d. u. v6 J
$ Y. t+ O, y! `
- j' N/ {; ?2 a: M3 X 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, q$ v/ Q6 M8 x9 _/ {- C6 n 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
9 Q- V2 h( Y! R1 v& e# c5 ], D, O 以下三个定义:1 N" P) N# P$ t
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & V/ S3 G5 p1 A" E6 H9 l- W) K2 f
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' `$ _7 v9 r2 \! H
所谓的双方优势策略则是指双方利益总和最大的策略。
+ T$ \( _- n `/ `& A9 N[编辑本段]严格优势策略举例分析
" {; z5 v7 u+ A! E7 j 一、经典的囚徒困境
+ ]5 L0 K3 t$ W$ E+ L7 p g 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , X. h$ P9 M8 R3 ^$ D
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: - h: Y* O2 h. K. I& o3 o; @
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( n& p& y4 g1 E9 q6 V/ ^ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 ]9 e6 `9 v5 F' s: g; R' f* H1 } 若二人都互相检举(互相“背叛”),则二人同样判监2年。
( U& \0 U: W" o4 h1 X) z . E# d4 j* N2 b0 P1 ~$ v! [; ~
用表格概述如下:$ n) K! `# u/ X0 U1 J+ o
. }0 p v% n: h! N' z" D5 k2 G 甲沉默(合作) 甲认罪(背叛) 0 ]8 o5 m# U6 G
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
# m9 ~' `/ h9 x# e乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
5 v, j; J2 I" p8 {4 D0 y# X* k# l9 u( F+ j2 O
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% }, \; B x" c1 I. Z1 W% \ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 O; k; r" M5 H 若对方沉默、背叛会让我获释,所以会选择背叛。 0 J3 Y3 z; S- W% g
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
; N8 k3 s. f- s* I' H 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 }6 ?) F3 V; U: y 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ( }% o4 f: q/ O8 i- Q* n$ x
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- F) N! _+ g1 K" v& d[编辑本段]二、智猪博弈理论) w5 n# M S, m1 s2 y5 k
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 3 V. e: ^ n1 t
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + {0 Q4 W3 ^4 q3 ~/ x# h
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' @% @& i7 a8 }7 j 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 W& z2 s) @7 [ v( a/ F “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ; F7 g, {5 a8 p6 \, }; S' ?
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ! X3 v" m& K% g* l1 S9 {; ~
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" h0 w! [% o" m- P
0 A, \8 w) R& d c( T
三、关于企业价格策略. D6 A+ B5 o+ P
8 V6 \, ?: B: j
% s& G5 I0 \8 }) Z; @2 e 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ B, `: W% t3 M/ V/ J/ M5 O( d
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 o7 C. ~) y8 i, l$ j1 ? 以下三个定义:
~/ v2 y; D* d s; u3 ~* J5 ? 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
3 W4 o1 G# r2 T 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 W) V* j! b; G4 K' R0 e8 y) V 所谓的双方优势策略则是指双方利益总和最大的策略。
6 R b# p( s0 c& f/ j% g |[编辑本段]严格优势策略举例分析
3 l; G, E& ~/ \& t' p 一、经典的囚徒困境 9 o3 n4 \% S' T Q) C
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ x2 j/ F& f( B2 ` 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: B; f; f6 n6 G0 R. s. Z& `4 `$ J 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
' B0 T7 H9 B) J% y* M/ D$ Z' W 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / M4 R+ e! H6 Q D
若二人都互相检举(互相“背叛”),则二人同样判监2年。3 c0 l1 u0 W+ z' C. J
6 I7 Z, j) q$ X, E用表格概述如下:
0 Y; f I) b4 _+ _" w m; P% y& ^. I4 r
甲沉默(合作) 甲认罪(背叛)
1 `) s2 {( E: ?& w) X2 P3 H乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ( W) l" `+ I7 z+ z; |4 r# C
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 6 Y6 W. U- S! d4 A$ b9 e2 n
+ f' M! p: H0 m' s6 w% b 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 U/ e% \+ V: d2 a/ W
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 M9 i; U( c0 s' L) { 若对方沉默、背叛会让我获释,所以会选择背叛。
' u9 \6 l9 [& l/ S! o8 r) { 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" i2 J4 [* G2 l3 h& a H( d 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; v! g7 Y" K6 W7 O 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % e8 F) J# f/ v; D- ]. W" I
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* V+ Y- K# g) ~
[编辑本段]二、智猪博弈理论6 u7 L& Z0 H5 S* C4 ? Y/ _
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! I: { Z: ], {; O' p: ]7 a
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
0 Q# f! L% ]* t. z/ ]& v: J9 i 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 L7 `4 q e6 b6 I
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' w8 z$ Q/ Y& j, D6 Y
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! y) i6 `% k0 j8 C v4 |) Y4 R- q1 R6 n 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ' ]! C$ ?( l9 v
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! u( g( }: z( T4 e! V
# g7 {' {/ T- U2 {, g5 C
三、关于企业价格策略
' L! K% x( h5 y4 `$ |/ I
X9 e0 L! w( ` `$ [; ?9 b
7 z/ j, X$ n5 C' R3 l5 Q" b 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; y9 q4 i( r5 m 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
) l' s: ]1 z1 g" ] 以下三个定义:5 E* N" O7 w7 \5 ~6 x3 l
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 }8 ^' t) i- U* Q$ W9 \5 B 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 6 o3 V, `9 ?1 ]! V3 b4 \
所谓的双方优势策略则是指双方利益总和最大的策略。 9 l, ], {! g' b5 p6 N( @% G
[编辑本段]严格优势策略举例分析
3 h V9 X# }3 ~ 一、经典的囚徒困境
1 m: q# H& S8 Z- b& O) ]/ ~ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
U7 T5 J; }3 o& Z: {% I, R 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 3 I9 K4 T0 R# I" P( z$ g5 i
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
# u1 i5 ^ P$ z- f' k( {# i 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* V4 y, m9 r5 a0 l 若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 l( |5 \. ]$ y* e6 q
4 j* u; N6 W3 w& N8 Y用表格概述如下:) }( x2 j/ j" ]- v2 M
8 L7 A9 k3 |4 ?6 ]% P/ t
甲沉默(合作) 甲认罪(背叛)
4 N. N' s* v! m: H& k; C# M1 G乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
. K) n% z) `+ |5 l6 p! Z: }乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
- h2 S, A0 Y P+ T- ^. }2 A* z" J' Y2 R" V; {! s9 G5 C2 B( T
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- k4 F! e7 h% @* i* ^ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 T9 H! f) R6 ? 若对方沉默、背叛会让我获释,所以会选择背叛。 * ?. K- R: j+ D4 K2 c0 s0 j; \3 W
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 @9 [ A: e$ f0 ?1 o. b' K
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 s7 Y" K, F1 B
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 m* O$ |7 _" S2 c9 R+ @4 D- ~: \
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" L, w1 \' w* ?' F* [; u
[编辑本段]二、智猪博弈理论
, N1 @; o% V5 j5 @7 S 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 5 V; z5 ~( B* F7 W1 Q
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' T" r) \% f: S6 X
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & z4 o0 y7 r1 O4 ^
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ( W* r# X5 J e, T( V9 Q& o4 {
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 S# o$ T4 ~- w( M8 Q
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ ] N1 W- H% j5 `4 t9 k 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
. V& h6 X8 k/ Y# V * h( n* S! j* E1 A1 D9 `$ f8 o& x& \, y
三、关于企业价格策略
2 y& I. Y& a3 M- K) _% ^. e4 O% t
: }' ~/ x/ W$ e
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? # K, S+ i8 f( h* \
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |