关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 4 ?! G0 b8 A- q$ s
/ J7 o: h' d# q3 r
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ `5 R. S: Y0 n2 c% j  以下三个定义:
8 [, b/ Z, Z( j) z  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
9 B/ c3 f$ |) g  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 . `) O/ a) k8 Z, u- e4 S
  所谓的双方优势策略则是指双方利益总和最大的策略。  . g$ r& V7 O' o5 J/ I
[编辑本段]严格优势策略举例分析
* Z& K7 X' q+ m' A/ {5 |  一、经典的囚徒困境 ' r0 T9 V9 L" g; p1 {  i5 ~
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: - b! ?9 R: Y; I
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: / `* f( n1 l- W8 x- X: z6 f9 {, v- D
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 z7 k$ p1 b6 i6 m- E
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & Z8 G' c& r# B1 D/ B
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ \# A. f0 l/ H! Z  9 J2 N4 W  E3 R% t' t) R8 |
用表格概述如下:
' Q3 j& H# K" P! o( s4 p2 a1 G
+ |6 G  s+ D% z( b    甲沉默(合作)  甲认罪(背叛)  
  o. ~6 g8 m: m乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
6 n' T" Y! v$ _- Z乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
1 f7 K  \& x# o. k4 g8 j: T2 e, f5 u5 g% G
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 : w/ P" L; H- q5 \; T! D$ D
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( {! e+ ]- \; |1 K" g
  若对方沉默、背叛会让我获释,所以会选择背叛。
, ~' f3 p; z7 {$ {/ e2 M1 w/ u/ b  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
) p( c8 O2 @4 [( l: |  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 |8 I* |7 r+ M$ `- z8 I% x, [  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。   e3 N0 ^; j8 Z+ W- D; ?. u
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ g  c8 h$ j5 V5 U[编辑本段]二、智猪博弈理论; @& I1 g* ^6 z; r3 _  ?
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 2 N: u9 K8 v4 T! [) \- [
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 m# N. `) i$ y2 j  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' M! |  A9 S1 R8 z  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
" E) e% w# i& T+ A  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* b7 H) E+ O& \8 ?  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 K5 m& S* L" u# k2 l4 m  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. U0 ~0 Q% T: y0 d+ A! h1 }* M: r- R
  # Z& j* K7 y6 k7 r/ o* G: J
三、关于企业价格策略
! w$ B7 d. u. v6 J
$ Y. t+ O, y! `  
- j' N/ {; ?2 a: M3 X  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, q$ v/ Q6 M8 x9 _/ {- C6 n  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
9 Q- V2 h( Y! R1 v& e# c5 ], D, O  以下三个定义:1 N" P) N# P$ t
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & V/ S3 G5 p1 A" E6 H9 l- W) K2 f
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' `$ _7 v9 r2 \! H
  所谓的双方优势策略则是指双方利益总和最大的策略。  
+ T$ \( _- n  `/ `& A9 N[编辑本段]严格优势策略举例分析
" {; z5 v7 u+ A! E7 j  一、经典的囚徒困境
+ ]5 L0 K3 t$ W$ E+ L7 p  g  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , X. h$ P9 M8 R3 ^$ D
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: - h: Y* O2 h. K. I& o3 o; @
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( n& p& y4 g1 E9 q6 V/ ^  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
6 ]9 e6 `9 v5 F' s: g; R' f* H1 }  若二人都互相检举(互相“背叛”),则二人同样判监2年。
( U& \0 U: W" o4 h1 X) z  . E# d4 j* N2 b0 P1 ~$ v! [; ~
用表格概述如下:$ n) K! `# u/ X0 U1 J+ o

. }0 p  v% n: h! N' z" D5 k2 G    甲沉默(合作)  甲认罪(背叛)  0 ]8 o5 m# U6 G
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
# m9 ~' `/ h9 x# e乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
5 v, j; J2 I" p8 {4 D0 y# X* k# l9 u( F+ j2 O
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% }, \; B  x" c1 I. Z1 W% \  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 O; k; r" M5 H  若对方沉默、背叛会让我获释,所以会选择背叛。 0 J3 Y3 z; S- W% g
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
; N8 k3 s. f- s* I' H  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 }6 ?) F3 V; U: y  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ( }% o4 f: q/ O8 i- Q* n$ x
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- F) N! _+ g1 K" v& d[编辑本段]二、智猪博弈理论) w5 n# M  S, m1 s2 y5 k
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 3 V. e: ^  n1 t
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 + {0 Q4 W3 ^4 q3 ~/ x# h
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' @% @& i7 a8 }7 j  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 W& z2 s) @7 [  v( a/ F  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ; F7 g, {5 a8 p6 \, }; S' ?
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ! X3 v" m& K% g* l1 S9 {; ~
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" h0 w! [% o" m- P
  0 A, \8 w) R& d  c( T
三、关于企业价格策略. D6 A+ B5 o+ P

8 V6 \, ?: B: j  
% s& G5 I0 \8 }) Z; @2 e  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ B, `: W% t3 M/ V/ J/ M5 O( d
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 o7 C. ~) y8 i, l$ j1 ?  以下三个定义:
  ~/ v2 y; D* d  s; u3 ~* J5 ?  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
3 W4 o1 G# r2 T  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 W) V* j! b; G4 K' R0 e8 y) V  所谓的双方优势策略则是指双方利益总和最大的策略。  
6 R  b# p( s0 c& f/ j% g  |[编辑本段]严格优势策略举例分析
3 l; G, E& ~/ \& t' p  一、经典的囚徒困境 9 o3 n4 \% S' T  Q) C
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ x2 j/ F& f( B2 `  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
: B; f; f6 n6 G0 R. s. Z& `4 `$ J  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
' B0 T7 H9 B) J% y* M/ D$ Z' W  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / M4 R+ e! H6 Q  D
  若二人都互相检举(互相“背叛”),则二人同样判监2年。3 c0 l1 u0 W+ z' C. J
  
6 I7 Z, j) q$ X, E用表格概述如下:
0 Y; f  I) b4 _+ _" w  m; P% y& ^. I4 r
    甲沉默(合作)  甲认罪(背叛)  
1 `) s2 {( E: ?& w) X2 P3 H乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ( W) l" `+ I7 z+ z; |4 r# C
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  6 Y6 W. U- S! d4 A$ b9 e2 n

+ f' M! p: H0 m' s6 w% b  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。   U/ e% \+ V: d2 a/ W
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 M9 i; U( c0 s' L) {  若对方沉默、背叛会让我获释,所以会选择背叛。
' u9 \6 l9 [& l/ S! o8 r) {  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" i2 J4 [* G2 l3 h& a  H( d  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
; v! g7 Y" K6 W7 O  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % e8 F) J# f/ v; D- ]. W" I
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* V+ Y- K# g) ~
[编辑本段]二、智猪博弈理论6 u7 L& Z0 H5 S* C4 ?  Y/ _
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! I: {  Z: ], {; O' p: ]7 a
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
0 Q# f! L% ]* t. z/ ]& v: J9 i  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 L7 `4 q  e6 b6 I
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ' w8 z$ Q/ Y& j, D6 Y
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! y) i6 `% k0 j8 C  v4 |) Y4 R- q1 R6 n  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ' ]! C$ ?( l9 v
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! u( g( }: z( T4 e! V
  # g7 {' {/ T- U2 {, g5 C
三、关于企业价格策略
' L! K% x( h5 y4 `$ |/ I
  X9 e0 L! w( `  `$ [; ?9 b  
7 z/ j, X$ n5 C' R3 l5 Q" b  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; y9 q4 i( r5 m  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
) l' s: ]1 z1 g" ]  以下三个定义:5 E* N" O7 w7 \5 ~6 x3 l
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 }8 ^' t) i- U* Q$ W9 \5 B  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 6 o3 V, `9 ?1 ]! V3 b4 \
  所谓的双方优势策略则是指双方利益总和最大的策略。  9 l, ], {! g' b5 p6 N( @% G
[编辑本段]严格优势策略举例分析
3 h  V9 X# }3 ~  一、经典的囚徒困境
1 m: q# H& S8 Z- b& O) ]/ ~  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
  U7 T5 J; }3 o& Z: {% I, R  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 3 I9 K4 T0 R# I" P( z$ g5 i
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
# u1 i5 ^  P$ z- f' k( {# i  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* V4 y, m9 r5 a0 l  若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 l( |5 \. ]$ y* e6 q  
4 j* u; N6 W3 w& N8 Y用表格概述如下:) }( x2 j/ j" ]- v2 M
8 L7 A9 k3 |4 ?6 ]% P/ t
    甲沉默(合作)  甲认罪(背叛)  
4 N. N' s* v! m: H& k; C# M1 G乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
. K) n% z) `+ |5 l6 p! Z: }乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
- h2 S, A0 Y  P+ T- ^. }2 A* z" J' Y2 R" V; {! s9 G5 C2 B( T
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- k4 F! e7 h% @* i* ^  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 T9 H! f) R6 ?  若对方沉默、背叛会让我获释,所以会选择背叛。 * ?. K- R: j+ D4 K2 c0 s0 j; \3 W
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 @9 [  A: e$ f0 ?1 o. b' K
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 s7 Y" K, F1 B
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 m* O$ |7 _" S2 c9 R+ @4 D- ~: \
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" L, w1 \' w* ?' F* [; u
[编辑本段]二、智猪博弈理论
, N1 @; o% V5 j5 @7 S  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 5 V; z5 ~( B* F7 W1 Q
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' T" r) \% f: S6 X
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & z4 o0 y7 r1 O4 ^
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ( W* r# X5 J  e, T( V9 Q& o4 {
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 S# o$ T4 ~- w( M8 Q
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ ]  N1 W- H% j5 `4 t9 k  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
. V& h6 X8 k/ Y# V  * h( n* S! j* E1 A1 D9 `$ f8 o& x& \, y
三、关于企业价格策略
2 y& I. Y& a3 M- K) _% ^. e4 O% t
  : }' ~/ x/ W$ e
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? # K, S+ i8 f( h* \
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )