本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 ) {- N$ T& ?9 Q0 t& z$ k
! L$ ^) c$ W! ^2 z8 i1 S严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
% B3 E" C/ P! ]; X3 [0 j9 h 以下三个定义:% T$ U3 W% g1 W; o
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 ?% e8 v7 Y6 T1 x4 [ w. z1 f
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; f$ p3 J& L; d' T# ^ 所谓的双方优势策略则是指双方利益总和最大的策略。
) x. H' r) @3 H$ K5 m( N5 u6 g# ~, t[编辑本段]严格优势策略举例分析/ P g8 y+ t' J; `; B8 d5 \
一、经典的囚徒困境
# t9 F7 @% d( o' e; e4 h' w$ V 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , ^* Q6 |* ], j* T
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 F; p0 d3 x3 u9 ]/ X
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 # H& v5 T( N$ j& \: ?2 L7 E
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! V$ O$ L- P+ h- ^! Y' a
若二人都互相检举(互相“背叛”),则二人同样判监2年。 ]4 _0 k) G) m
4 U& z8 \: ]$ z9 Y6 g用表格概述如下:
5 Y0 k9 p9 M( `9 ~9 D9 S6 D
' M0 Z* c4 C% C' o2 b 甲沉默(合作) 甲认罪(背叛)
U. _# g g5 M- P: z& t, `乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
$ X2 d+ n8 S7 I8 ^6 X* W2 n乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
: b0 l S& L/ ]' D" y7 U+ c: }( K
# z& x h, ]: U" ~' o7 O; G9 @% u 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 4 Z7 j3 R1 M4 q6 l
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: " Y+ y X( t. D: y
若对方沉默、背叛会让我获释,所以会选择背叛。 2 [4 M# z. n+ A I2 u+ v9 Y8 L
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ' e5 k# m8 P6 e; N
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 z, M( \: [* k
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ' E* T. l6 |8 _1 j
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。) ]2 N/ ~0 h' j5 ^: U/ O
[编辑本段]二、智猪博弈理论
# A+ f2 F. ^3 b5 G. x6 |4 X( m 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 5 T# r. |7 G) w! R
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
" x8 ~% U3 O- G# ~ 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 , m0 [. g4 k- E3 D+ [
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 - W6 \# x) I/ b. Q' ]; @# S- L
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
+ l: l, y5 I; I5 Q; z( a 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( w* u3 h3 x; L 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 A9 d2 C3 W3 m' b+ u% c ' q$ L! O7 T( J; ^. Y4 g
三、关于企业价格策略
6 t& T5 x6 I0 |% `+ q/ q0 l4 J, g. L
9 e! C2 f( k2 E/ |
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , F* x& z0 s+ N2 p. C4 o
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
" y3 z3 d1 r9 J$ v4 o0 O 以下三个定义:
/ f8 b2 m. v3 R2 S 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 - G6 A/ G5 [6 f. f
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 H# I$ ]6 b C3 E
所谓的双方优势策略则是指双方利益总和最大的策略。 6 z/ s$ b% u1 z9 x# y
[编辑本段]严格优势策略举例分析
( X4 s* G- ]1 F9 Z* L( C! y& b 一、经典的囚徒困境 & N4 s6 n; q9 E2 F) e! s
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: % P% G ]$ e$ T# \; }
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 7 Q$ ~& w7 C" i( u% J
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 F* h8 q; M& [3 E, e
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 - u$ X4 s. h% s; {1 N( z
若二人都互相检举(互相“背叛”),则二人同样判监2年。+ R; d# l3 @& ^* b
$ ^5 x S0 k4 f6 G. p用表格概述如下:
/ G, [' [- |! I7 Y q( P$ g9 v( m b- m) y' p$ T
甲沉默(合作) 甲认罪(背叛)
: h1 e% d0 O6 E* f) m% v* J4 V6 K乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
1 a0 P$ _$ G( A" ]乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
' @+ t, y" l& G- c+ r$ k
5 t; ]% z( q4 ]+ G3 t: Y 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
1 r' U/ r' C+ X$ z 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: / R# [# w. f1 U* t3 O
若对方沉默、背叛会让我获释,所以会选择背叛。 ; n* i/ a) [4 j- f/ E
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 . _& @3 O' ^. X
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 4 T# g4 R5 d# L1 K- F
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
6 r7 Y- k0 o2 J# c7 @ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。8 f* m6 Y# m. s5 o7 Y1 p @8 _
[编辑本段]二、智猪博弈理论
8 B# }$ z" Y8 H3 S f L7 m- D 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 X7 v% R9 R$ L c' u) a3 P
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! h$ E$ b& K2 R) }5 F3 u* A
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 2 C; x1 Y) @9 J/ y8 s
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
/ @1 ?$ a* ?4 E9 I “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 2 B; k! i# S, j
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 / }# I& ]: h1 {
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 z9 Q4 N9 {6 @" x0 |
( J7 d9 T' @% Y. y
三、关于企业价格策略
5 ~) b8 r! f3 V8 b6 u( I6 W& \8 B% Y
2 @" D' H, Q) o, k t: u 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ A% Y5 V* t. ]2 u3 P5 d3 k
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 _. i$ I. f! I2 U* H2 b 以下三个定义:) R' r$ H8 L% t0 L% S& c) x# F
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 - C/ Q: Q6 V8 S) c* x- o
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( _' v. g8 e" {3 i) A5 M
所谓的双方优势策略则是指双方利益总和最大的策略。 ?& z$ L9 Q" x" v" |) @
[编辑本段]严格优势策略举例分析
2 |8 @) O( K8 r6 t) m 一、经典的囚徒困境 & V- A: ~/ }# j: I
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' J0 U( i* f1 ], T3 i8 _ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ k+ [$ v e" v4 o I. N$ G, ~5 x 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 5 N5 O" H3 M3 Q+ p* L( [6 n
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
& ~/ Z3 g6 H1 ?) z. N# q M* O2 E 若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 R' u N; ? n' t2 J2 p/ P* } i5 \7 x/ X+ Y
用表格概述如下:
7 E* h8 }9 }" l+ q. {5 t% h
) O2 V. J: Y$ P9 X 甲沉默(合作) 甲认罪(背叛)
3 u3 ]5 n% @) o" ?9 s* Q' d# J2 W+ T乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
) b* T$ A7 C' L; O乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
$ ]: [8 p% y$ Q2 I- I1 M2 `; E% m, z0 m( R4 q& I
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% J3 H' m t: d: H2 C 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: - H& j5 S; [1 B) C( V3 h/ P7 z. |
若对方沉默、背叛会让我获释,所以会选择背叛。
( r; C- G, H% ^9 h8 H: W6 { 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ( M/ c* g' _, Y: F, }* _) g
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' l$ I& }- } H* l5 I
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
, [# N) x* x, M% X0 [ 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ q% u# r8 A2 C[编辑本段]二、智猪博弈理论
6 ]* t2 |& r% n; D4 I 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ Y+ P0 s$ w- o2 v 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
: F/ A/ E$ O4 f# ~+ d& K5 B* J1 \& |* J 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. P1 r* p% }3 s& ] 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
: }/ ]+ a+ h, l2 U/ I c “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
: X0 a/ m! r( z 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& }. U0 q. I/ k2 y5 [* i 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 B$ G0 X4 B9 Y2 w& `
/ j0 n: z- W" W* Y6 m$ q, _) G, D
三、关于企业价格策略5 x7 p% W8 s( C/ p# G) ^
, e8 U6 U- U6 Q; |( q* H
) t1 U6 m6 P' d 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? A) i5 `: X. E
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 X0 [# g" `& V! Z
以下三个定义:1 [8 Z3 t( E7 F2 n# k& S8 y
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; |0 t( u, y! t' f
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
9 [9 y4 Y" c2 Q3 ?9 b O/ M! M 所谓的双方优势策略则是指双方利益总和最大的策略。
3 z, h- y9 x5 _" x: e[编辑本段]严格优势策略举例分析7 @4 [( V0 u* r2 Z9 ^. M# Y
一、经典的囚徒困境
: F# n0 B5 I) B 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 3 J9 p) T' W9 |' ^
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: . r( S2 J1 @* O, K- t' V
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 |/ C+ ^% ^ n# K N7 X. O! D
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ {8 q) H+ J' Z4 n6 k 若二人都互相检举(互相“背叛”),则二人同样判监2年。
& m) N2 q1 U* H 6 ]4 C- u0 o# v2 J+ G O! u
用表格概述如下:$ @; g8 r' E8 Q0 |
1 A: e5 S/ d+ J$ h7 B0 `1 V 甲沉默(合作) 甲认罪(背叛) , [' H2 B5 E& K. ~- t7 _# f% J
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
3 x8 f% ^& Q6 O乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 6 v* g; f1 z1 g6 G: w5 A. S
; U5 T5 m2 D5 l5 T: I 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 . \- V0 R: I! z; y4 @
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: - k6 r. A9 i8 e. ^3 A
若对方沉默、背叛会让我获释,所以会选择背叛。 % ~! F3 g9 s7 @! H! p
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 o2 I8 p/ u6 r& N9 T; i
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 U5 v5 j; z/ M% C 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
0 G( w) U) Z6 j8 O 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。* d. V3 g4 j: d) ~ e# c% d: F
[编辑本段]二、智猪博弈理论0 n$ P" W0 Y O- s) I6 a
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( {3 U* n% f( J0 p8 K 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
+ U- z( ^5 j$ k! q0 P" s9 a. [ 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ C1 }7 |3 t* ~1 q, C2 o 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# s4 \* w( m3 P( |# ]9 T “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* s6 D$ ?4 ~ o5 M- Z 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 4 t& N; X) ^+ C% g& Q
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。- F5 b% H4 t/ {8 ` ?
8 h, P+ y0 [6 k+ L* [8 r8 ^' G三、关于企业价格策略" ^- q1 y# x/ a3 M p l. `1 D
[& \" \, e3 @* A8 j! f9 K & }1 e; }0 ^6 o, H+ u. q" {0 e
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
! T, ]! { L! S5 `9 b 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |