版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、,,1.界定博弈論的一些基本概念;2.界定優(yōu)勢(shì)策略和納什均衡3.理解囚犯困境的含義及其應(yīng)用;4.推導(dǎo)重復(fù)性博弈的納什均衡;5.推導(dǎo)序列博弈的納什均衡;,本章要點(diǎn),,學(xué)完本章,你將能夠,11 博弈論基礎(chǔ),©2011-13 王秋石,2/100,,,6.理解為什么存在著先動(dòng)優(yōu)勢(shì);7.理解進(jìn)入威懾的可信性問(wèn)題8.推導(dǎo)混合策略的納什均衡,本章要點(diǎn),,學(xué)完本章,你將能夠,11 博弈論基礎(chǔ),©2011-13 王秋石,3
2、/100,博弈就是一種比賽,©2011-13 王秋石,比賽可以比快,也可以比慢。,4/100,博弈論的基本概念,博弈論(game theory):又稱(chēng)對(duì)策論,是用于分析策略性行為的一種工具。博弈的分析步驟第一步是尋找到某種有用的方式來(lái)描述這場(chǎng)博弈;第二步是尋找某種方式來(lái)預(yù)測(cè)結(jié)果。博弈的要素(1)選手;(2)規(guī)則;(3)策略;(4)收益;(5)結(jié)果。,©2011-13 王秋石,5/100,“剪子、石頭、布”的
3、博弈,該游戲有兩個(gè)選手(players),即參與此博弈的行為者;每個(gè)選手有三種策略(strategies)可供選擇:1出剪子;2出石頭;3出布。通俗點(diǎn)說(shuō),策略就是出招兒。該游戲有個(gè)規(guī)則:如果兩人出了相同的策略(如石頭對(duì)石頭等三種可能性),雙方為打平;如果兩人出手不一(如石頭對(duì)剪子等六種可能性),則可決定出勝負(fù),石頭贏剪子、剪子贏布、布贏石頭(即石頭砸剪子、剪子剪布、布包石頭)。,©2011-13 王秋石,6/100,“剪子
4、、石頭、布”的博弈,在游戲之前,雙方達(dá)成獎(jiǎng)懲協(xié)議:如贏家賺1元,輸家輸1元;或者贏家不喝酒,而輸家罰酒一杯等等。假如是輸贏1元的協(xié)議,表(11.1)就是這個(gè)游戲的收益表(Payoff table),把選手的收益狀況用表的形式描述,有時(shí)亦稱(chēng)收益矩陣(Payoff matrix)。,©2011-13 王秋石,7/100,收益表,如果A出石頭,B也出石頭,各自收益均為0;,©2011-13 王秋石,,,,,,,8/100
5、,收益表,如果A出石頭,B出剪子,A的收益為1,B的收益為(-1);,©2011-13 王秋石,,,,,,,9/100,收益表,如果A出石頭,B出布,A的收益為(-1),而B(niǎo)的收益為1。,©2011-13 王秋石,,,,,,,余此類(lèi)推,10/100,博弈論的基本概念,一般來(lái)說(shuō),在每個(gè)小方框內(nèi),第一個(gè)數(shù)據(jù)為排在左邊的選手A的收益,第二個(gè)數(shù)據(jù)為排在上方的選手B的收益,中間用逗號(hào)隔開(kāi),即(A,B)=(0,0)等等。上表是
6、一種常見(jiàn)的用表格描述一場(chǎng)博弈的方法,簡(jiǎn)稱(chēng)常規(guī)式博弈(normal form)。同時(shí)博弈:要求選手同時(shí)出招的博弈。序列博弈: 選手可以分先后時(shí)間出招的博弈。,©2011-13 王秋石,11/100,優(yōu)勢(shì)策略,假定A、B 兩人在玩一個(gè)十分簡(jiǎn)單的博弈,A 在紙上可以寫(xiě)“上”或“下”,B 在另外一張紙上可以寫(xiě)“左”或“右”,其收益矩陣如下表所示。,©2011-13 王秋石,每個(gè)選手都是自我利益極大化者。,12/100,
7、優(yōu)勢(shì)策略,如果B選左,A選上的收益為1,而選下的收益為2,那么,A選下;,©2011-13 王秋石,,,,,,,,如果B選右,A在收益0與1之間選擇,A選擇下。,,,13/100,優(yōu)勢(shì)策略,優(yōu)勢(shì)策略:無(wú)論對(duì)方選擇什么策略,該選手總是選擇某種固定的策略,又稱(chēng)占優(yōu)策略。在本例中,無(wú)論B出什么招,A總是選下。因此,選下是A的優(yōu)勢(shì)策略。所謂優(yōu)勢(shì)策略,就是無(wú)論你出什么招,我就出這一招。選手B也有優(yōu)勢(shì)策略嗎?,©2011-
8、13 王秋石,14/100,優(yōu)勢(shì)策略,給定A選上,B選左的收益為1,而選右的收益為2,那么,B選左;,©2011-13 王秋石,,,如果A選下,B在收益0與1之間選擇, B選左。,,,,,,,,15/100,優(yōu)勢(shì)策略,無(wú)論選手A如何選擇,B將始終選擇左。B選擇左是優(yōu)勢(shì)策略。在某個(gè)博弈中,如果每個(gè)選手都有一種優(yōu)勢(shì)策略,那么,兩個(gè)選手的優(yōu)勢(shì)策略組合就是這一博弈的均衡。所謂博弈的均衡就是會(huì)發(fā)生的一種結(jié)局。,©2011
9、-13 王秋石,16/100,優(yōu)勢(shì)策略,在上例中,(A,B)=(下,左)=(2,1)就是該博弈優(yōu)勢(shì)策略的均衡結(jié)果。,©2011-13 王秋石,,17/100,優(yōu)勢(shì)策略,大學(xué)成功秘訣: 不管你如何,我始終把努力學(xué)習(xí)作為我的優(yōu)勢(shì)策略。,©2011-13 王秋石,18/100,納什均衡,并非所有的博弈都存在優(yōu)勢(shì)策略均衡。,©2011-13 王秋石,在以下改進(jìn)的博弈中,如果B選左,A就選上;如果B選右,A就選下;
10、因此,A沒(méi)有優(yōu)勢(shì)策略。,,,,,?,,,19/100,納什均衡,同理可以分析,B也沒(méi)有優(yōu)勢(shì)策略。,©2011-13 王秋石,,,,,?,,那么該博弈是否存在著均衡呢?,,,20/100,納什均衡,優(yōu)勢(shì)策略均衡的要求也許太高了點(diǎn)。它要求無(wú)論B 出什么招,A 有一個(gè)優(yōu)勢(shì)策略;而且還要求無(wú)論A 出什么招,B 也有一個(gè)優(yōu)勢(shì)策略。這兩個(gè)優(yōu)勢(shì)策略的組合才構(gòu)成一個(gè)優(yōu)勢(shì)策略均衡。如果給定B 的選擇,A 的選擇是最佳的;同時(shí)給定A 的選擇,
11、B 的選擇也是最佳的,那么,A 和B 的這組最佳選擇的組合就是納什均衡。,©2011-13 王秋石,21/100,約翰?納什,這是以1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主、美國(guó)經(jīng)濟(jì)學(xué)家約翰·納什的名字命名的。瑞典皇家科學(xué)院的公報(bào)稱(chēng):“納什由于引入了合作博弈與非合作博弈的區(qū)分,并為非合作博弈創(chuàng)立了一種均衡概念。這種均衡概念現(xiàn)在被命名為‘ 納什均衡’”,©2011-13 王秋石,22/100,約翰·納什,納什
12、均衡,如果B 選左,A 的最佳選擇為上;,©2011-13 王秋石,,,,,如果B 選右,A 的最佳選擇為下;,如果A 選上,B 的最佳選擇為左;如果A 選下,B的最佳選擇為右。,,,,,兩箭頭所指就是納什均衡。,23/100,納什均衡,給定B 選左,A 的最佳選擇為上;給定A選擇上,B的最佳選擇為左 ;所以,(上,左)為納什均衡。,©2011-13 王秋石,同理,(下,右)為另一組納什均衡。,,,24/100,優(yōu)勢(shì)
13、均衡與納什均衡的聯(lián)系與區(qū)別,優(yōu)勢(shì)策略:無(wú)論你做什么,我做我最好的;無(wú)論我做什么,你做你最好的。納什均衡:給定你的策略,我做我最好的;給定我的策略,你做你最好的。由此可見(jiàn),優(yōu)勢(shì)策略均衡便是納什均衡的一種特例。通俗地講,如果是優(yōu)勢(shì)策略均衡,就一定是納什均衡;反之,則不然。,©2011-13 王秋石,25/100,囚犯困境,有兩個(gè)嫌疑犯A和B因合伙偷竊自行車(chē)被警方捉拿歸案,且證據(jù)確鑿,可判他們每人各2年的徒刑。如果他倆都承認(rèn)犯
14、有搶劫銀行罪,當(dāng)局就以?xún)勺锊⒘P,各判10年監(jiān)禁;如果兩嫌疑犯都否認(rèn)犯有搶劫銀行罪,當(dāng)局則以偷自行車(chē)罪各判2年刑;如果一方承認(rèn)犯有搶劫銀行罪并提供有效證據(jù),而另一方拒絕承認(rèn)的話,當(dāng)局以“坦白從寬,抗拒從嚴(yán)”的原則,對(duì)承認(rèn)犯罪者不再追究偷竊自行車(chē)罪而釋放,而對(duì)否認(rèn)者三罪并罰(偷自行車(chē)、搶劫銀行和不誠(chéng)實(shí)罪)投監(jiān)20年。,©2011-13 王秋石,26/100,囚犯困境,在這個(gè)游戲中,有兩個(gè)選手:囚犯A和B,每個(gè)選手均有兩種策略。承
15、認(rèn)或否認(rèn)犯有搶劫銀行罪,有可能出現(xiàn)四種結(jié)果,其收益矩陣如表11.4所示。表中第一列,如果A和B同時(shí)承認(rèn)犯罪各坐牢10年;如果A否認(rèn)犯罪,而B(niǎo)承認(rèn)犯罪,A坐牢20年,而B(niǎo)卻可自由,表的第二列依此類(lèi)推。,©2011-13 王秋石,27/100,囚犯困境,對(duì)策論的一個(gè)中心問(wèn)題如果我相信我的對(duì)手是理性的,我如何給定他的行為做出我的一個(gè)最優(yōu)決策,即給定對(duì)手行為,我如何做出最佳選擇。這個(gè)對(duì)策存在著均衡嗎?,©2011-13
16、王秋石,28/100,囚犯困境,給定對(duì)方承認(rèn),你也承認(rèn);給定對(duì)方否認(rèn),你承認(rèn)。(承認(rèn),承認(rèn))=(-10,-10)就是是優(yōu)勢(shì)策略均衡;于是(承認(rèn),承認(rèn))也是囚犯困境的納什均衡。,©2011-13 王秋石,,,,,,29/100,囚犯困境,為什么把它稱(chēng)為“囚犯困境” 呢?(承認(rèn),承認(rèn))=(-10,-10)是納什均衡。如果他們都否認(rèn)犯罪,每人只需坐牢2年,而不是10年。(否認(rèn),否認(rèn))是一種帕累托效率,而(承認(rèn),承認(rèn))一種帕累托
17、非效率。囚犯困境的“困惑”就在于為什么納什均衡并非是帕累托最優(yōu),而帕累托效率又不是納什均衡的結(jié)果呢?,©2011-13 王秋石,30/100,囚犯困境及其應(yīng)用,囚犯困境隱含著,合謀也許是一個(gè)更為有效的結(jié)果。囚犯困境是在向看不見(jiàn)手的挑戰(zhàn)。亞當(dāng).斯密的看不見(jiàn)的手理論認(rèn)為,市場(chǎng)經(jīng)濟(jì)中的每個(gè)人都在追求自我利益,但在追求自我利益的過(guò)程中同時(shí)也實(shí)現(xiàn)了社會(huì)的公共利益。囚犯困境卻揭示社會(huì)中的每個(gè)人都在追求自我利益,然而,人類(lèi)社會(huì)的公共利
18、益卻不可能實(shí)現(xiàn)。,©2011-13 王秋石,31/100,囚犯困境一種表現(xiàn),©2011-13 王秋石,32/100,你急我急大家急急成一團(tuán)(請(qǐng)對(duì)下聯(lián)),廣告困境,做廣告導(dǎo)致需求增加,將激勵(lì)企業(yè)大量做廣告。其一,廣告之后,原本沒(méi)使用過(guò)本產(chǎn)品的人了解了產(chǎn)品,其中一部分可能購(gòu)買(mǎi)之;其二,一些在使用其它同類(lèi)品牌的人可能轉(zhuǎn)換過(guò)來(lái)消費(fèi)本產(chǎn)品。現(xiàn)假定有兩家寡頭面臨著兩個(gè)選擇:(大量)做廣告和不(大量)做廣告。在現(xiàn)實(shí)經(jīng)濟(jì)中,
19、他們要選擇做多少?gòu)V告的問(wèn)題。為了簡(jiǎn)化起見(jiàn),也不失一般性,就假定只有這兩種選擇。,©2011-13 王秋石,33/100,可口可樂(lè)與百事可樂(lè)之爭(zhēng),©2011-13 王秋石,34/100,可口可樂(lè)與百事可樂(lè)之爭(zhēng),©2011-13 王秋石,35/100,廣告困境之一,無(wú)論A如何,B始終要做廣告,做廣告是B的優(yōu)勢(shì)策略;同理,做廣告也是A的優(yōu)勢(shì)策略。,©2011-13 王秋石,,,,,■因此,(做廣告,做廣
20、告)=(300,300)便成為此博弈的優(yōu)勢(shì)策略均衡,同時(shí)也是納什均衡。,,36/100,廣告困境之二,企業(yè)B 的優(yōu)勢(shì)策略是做廣告,而企業(yè)A 卻沒(méi)有優(yōu)勢(shì)策略。如果B做廣告,A 最好跟著做廣告;但如果B 不做廣告,A 最好的策略也是不做廣告。,©2011-13 王秋石,,,,,37/100,廣告困境,因此,(做廣告,做廣告)=(200,300)依然是納什均衡。,©2011-13 王秋石,,,,■但是,(不做廣告,不做廣告
21、)=(500,600)卻是一種帕累托最優(yōu),但對(duì)這種非合作性博弈就偏偏實(shí)現(xiàn)不了。,,38/100,禁播香煙廣告的法案,1971 年1 月1 日,美國(guó)眾議院通過(guò)了禁止在電視上播出香煙廣告的法案.但法案的制定者當(dāng)初并不知道它有利于解決香煙廣告困境問(wèn)題。它使得美國(guó)煙草制造商們花在香煙上的廣告費(fèi)從此法案實(shí)施前一年的3 億美元下降到了實(shí)施后一年的6 000 多萬(wàn)美元,這其中大部分都轉(zhuǎn)化為煙草行業(yè)的利潤(rùn)了。,©2011-13 王秋石,3
22、9/100,研發(fā)博弈,研發(fā)是指企業(yè)研究新技術(shù)、開(kāi)發(fā)新產(chǎn)品的活動(dòng)?,F(xiàn)假定有兩個(gè)實(shí)力相當(dāng)?shù)墓杨^在兩大策略中選擇研發(fā)和不研發(fā),其假定的收益矩陣如表11.7所示。,©2011-13 王秋石,,,,,40/100,研發(fā)博弈,寡頭A 和寡頭B 都存在著一種優(yōu)勢(shì)策略——研發(fā),所以,(研發(fā),研發(fā))成為本博弈中的納什均衡。其實(shí),雙方達(dá)到合謀都不研發(fā)或者少研發(fā)是一種帕累托改進(jìn)。,©2011-13 王秋石,,,41/100,產(chǎn)量困境:古
23、諾解,我們?cè)诘?0章介紹古諾模型時(shí)假設(shè),有兩家寡頭生產(chǎn)同質(zhì)的礦泉水,每家寡頭的邊際成本為零,其共同的市場(chǎng)需求曲線為: p=120-q■企業(yè)A和企業(yè)B的數(shù)量反應(yīng)函數(shù)分別為:,©2011-13 王秋石,■求解古諾解為:,42/100,產(chǎn)量困境:古諾解,如果兩家組成卡特爾,像一個(gè)壟斷者那樣生產(chǎn),那么,MR=MC=0,平分市場(chǎng)后有:,©2011-13 王秋石,■如果A 生產(chǎn)30,但B 違
24、約生產(chǎn)40,這樣,p =50,πA =1 500, πB =2 000,因此,B 有違約的激勵(lì)。,■同理,如果B 生產(chǎn)30,但A 違約生產(chǎn)40,這樣p = 50, πA = 2 000, πB =1 500,因此,A 有違約的激勵(lì)。,43/100,產(chǎn)量困境:古諾解,把上述情況用利潤(rùn)矩陣描述成下表。,©2011-13 王秋石,44/100,產(chǎn)量困境:古諾解,給定B合作,A違約,給定B違約,A違約;,©2011-13 王
25、秋石,,,,,給定A合作,B違約,給定A違約,B違約;,45/100,產(chǎn)量困境:古諾解,(違約,違約)=(1600,1600)成為納什均衡。,©2011-13 王秋石,,,,■合謀性壟斷產(chǎn)量(各為30)使得雙方利潤(rùn)都更高(1800,1800),但它不是一種納什均衡。,,46/100,囚犯困境及其應(yīng)用,以上幾個(gè)例子都有一個(gè)共同特征:合作性博弈的解優(yōu)越于非合作性博弈,但合作又不是納什均衡。在現(xiàn)實(shí)生活中畢竟有一些(短暫)合作成功的
26、案例。《核武器不擴(kuò)散條件》、《有核國(guó)家不首先使用核武器條約》,甚至《兩國(guó)導(dǎo)彈互不對(duì)準(zhǔn)條約》。在現(xiàn)實(shí)生活中,有些囚犯就是不承認(rèn)犯罪,原因是這些博弈不是玩一次,而是在重復(fù)性地玩。,©2011-13 王秋石,47/100,重復(fù)性博弈,在現(xiàn)實(shí)生活中,寡頭間關(guān)于彼此產(chǎn)量和價(jià)格的決策遠(yuǎn)不止一次,他們根據(jù)對(duì)手的行為在不斷地調(diào)整自己的產(chǎn)量和價(jià)格。這種不斷調(diào)整其策略并改變收益的博弈被稱(chēng)為重復(fù)性博弈。當(dāng)囚犯困境的雙方只能進(jìn)行一次性博弈時(shí),很
27、難進(jìn)行有效的懲罰;而在重復(fù)性博弈時(shí),有效的懲罰對(duì)方或者威脅對(duì)方就成為可能了。重復(fù)性博弈——擺脫囚犯困境。,©2011-13 王秋石,48/100,重復(fù)性博弈,20 世紀(jì)60 年代進(jìn)行的實(shí)驗(yàn)性研究尋找到了一種簡(jiǎn)單的辦法——以牙還牙(tit-for-tat)策略——能夠有效地讓意欲違約者保持克制。以牙還牙策略是指在重復(fù)性博弈過(guò)程中某一選手對(duì)對(duì)方在前一期的合作同樣也采取合作的態(tài)度,對(duì)對(duì)方不合作則采取報(bào)復(fù)性的策略。在囚犯困境的重
28、復(fù)性博弈中,大家都清楚地知道,合作的巨大收益提供了合作的正面激勵(lì),對(duì)方的有效威脅和潛在傷害則提供了合作的負(fù)面激勵(lì)。,©2011-13 王秋石,49/100,重復(fù)性博弈:價(jià)格,在固定價(jià)格的一次性博弈中,哪怕有約在先,雙方都保持壟斷價(jià)格同時(shí)分享市場(chǎng)需求,最后的均衡為各自采用競(jìng)爭(zhēng)性?xún)r(jià)格獲得零經(jīng)濟(jì)利潤(rùn)。但在重復(fù)性博弈中,情況有所不同。雙方知道,如果我降價(jià),對(duì)方一定會(huì)降價(jià),可能降得還更慘,對(duì)方要置我于死地而后快;如果我采取合作態(tài)度,對(duì)
29、方很可能也會(huì)合作。為什么我不首先采取合作態(tài)度——把價(jià)格定在壟斷價(jià)格呢?,©2011-13 王秋石,50/100,重復(fù)性博弈:日常生活,在公交車(chē)上,我們很少為素不相識(shí)的乘客買(mǎi)車(chē)票,因?yàn)檫@大凡是一次性博弈。而我們很可能為朋友買(mǎi)車(chē)票,我們與朋友的交往是重復(fù)性博弈。如果他是個(gè)吝嗇鬼,你可以選擇不與他同車(chē)等。在重復(fù)性博弈中,每個(gè)人都比較關(guān)心自己的聲譽(yù),正是這種聲譽(yù)機(jī)制使得人們大量采取合作性策略。,©2011-13 王秋石
30、,51/100,重復(fù)性博弈:軍事合作,牙還牙策略在軍事上也有所表現(xiàn)?!队泻藝?guó)家首先不使用核武器的協(xié)議》到目前為止遵守得很好的原因就是這個(gè)以牙還牙策略。但是,《兩國(guó)導(dǎo)彈互不對(duì)準(zhǔn)協(xié)議》遵循得就會(huì)差一些,兩國(guó)關(guān)系一旦惡化,很有可能都在暗地里違約。,©2011-13 王秋石,52/100,重復(fù)性博弈:戰(zhàn)地醫(yī)院,以牙還牙策略可以使戰(zhàn)地醫(yī)院享受愛(ài)情的浪漫。如果你專(zhuān)門(mén)轟炸對(duì)方的戰(zhàn)地醫(yī)院,你自己的醫(yī)院也就處于危險(xiǎn)之中。如果你打我的戰(zhàn)地
31、醫(yī)院,我絕對(duì)要以牙還牙,報(bào)仇雪恨。以上這些對(duì)人類(lèi)行為的觀察能夠幫助我們更好地認(rèn)識(shí)人類(lèi)的行為方式。,©2011-13 王秋石,53/100,重復(fù)性博弈,以牙還牙策略能否成功實(shí)施取決于博弈的次數(shù)。我們將重復(fù)性博弈按次數(shù)分類(lèi)為有限次重復(fù)性博弈和無(wú)限次重復(fù)性博弈。有限次重復(fù)性博弈就是未來(lái)博弈的次數(shù)已經(jīng)確定的博弈,也被稱(chēng)為固定次數(shù)的重復(fù)性博弈。無(wú)限次重復(fù)性博弈就是可以無(wú)限次數(shù)地、重復(fù)性地玩的一種博弈。,©2011-13
32、王秋石,54/100,有限次重復(fù)性博弈,假定我們知道囚犯困境博弈只玩十次,現(xiàn)在就是最后一次,結(jié)果會(huì)如何呢?最后玩的那次博弈就像只玩一次的博弈。因此,兩者的結(jié)果應(yīng)該是相同的。第九輪會(huì)如何呢?我們已知在第十輪雙方都會(huì)承認(rèn)犯罪,為什么在第九輪就要合作呢?同理,第八輪、第七輪……都會(huì)出現(xiàn)只玩一次博弈的納什均衡。只要這一博弈重復(fù)的次數(shù)已知,每一輪的結(jié)果都是原納什均衡的結(jié)果。,©2011-13 王秋石,55/100,無(wú)限次重復(fù)性博弈
33、,以牙還牙策略只有在無(wú)限次重復(fù)性博弈中才能有效。歐佩克(OPEC)是一個(gè)合作比較成功的卡特爾組織,其原因之一就是無(wú)限次重復(fù)性博弈所隱含的各種懲罰機(jī)制。無(wú)限次重復(fù)性博弈所形成的合作均衡解并不是穩(wěn)定的,它較為容易被打破。,©2011-13 王秋石,56/100,序列博弈,到目前為止所討論的博弈都是兩個(gè)選手要同時(shí)選擇策略。例如,在古諾模型中,兩家企業(yè)同時(shí)決定產(chǎn)量。在序列博弈中,選手們按先后順序進(jìn)行選擇。因此,序列博弈就是選手依
34、次出招的博弈。斯坦伯格模型就是序列博弈的一個(gè)例子,一企業(yè)是領(lǐng)導(dǎo)者,率先決定其產(chǎn)量,另一企業(yè)是跟隨者,相應(yīng)決定其產(chǎn)量。,©2011-13 王秋石,57/100,序列博弈,經(jīng)過(guò)分析,我們知道該博弈有兩個(gè)納什均衡:(上,左)和(下,右)。但是,我們將說(shuō)明其中的一個(gè)均衡不大合理。,©2011-13 王秋石,,,58/100,擴(kuò)展型博弈,圖11. 1 是表11. 9 中的博弈的擴(kuò)展型博弈,它有些像樹(shù)狀,故被稱(chēng)為博弈樹(shù)。因此
35、,用博弈樹(shù)表示的博弈被稱(chēng)為擴(kuò)展型,用表格所表示的博弈被稱(chēng)為常規(guī)型。,©2011-13 王秋石,59/100,擴(kuò)展型博弈,,©2011-13 王秋石,■如何求解擴(kuò)展型博弈的納什均衡呢?,■ 假定A已經(jīng)選擇了上,B一定會(huì)選擇左,收益為(1,9);,,,,,,,■ 但如果A選擇下,B只好選擇右,收益為(2,1)。,60/100,擴(kuò)展型博弈,,©2011-13 王秋石,A是先動(dòng)者,在信息完備時(shí),當(dāng)他看到博弈樹(shù)端點(diǎn)的
36、收益情況后,他一定會(huì)選擇下。,這樣(上,左)就不再是一個(gè)合理的均衡了。從擴(kuò)展型博弈看,(下,右)是唯一的納什均衡。,,,,,61/100,“先動(dòng)優(yōu)勢(shì)”,A好開(kāi)心,他享受到了“先動(dòng)優(yōu)勢(shì)”。一步為先,步步為先。再看看選手B,他有些可憐,他本可享受9,最后只好收益為1。他要看人家的臉色行事。,©2011-13 王秋石,62/100,“先動(dòng)優(yōu)勢(shì)”,當(dāng)然,他可以向A發(fā)出威脅:如果A選下,他報(bào)復(fù)性地選左,兩人都同歸于盡,各自收益為零。
37、如果A相信B會(huì)實(shí)施威脅,A只好選擇上,這樣,A的收益至少為1,而不是零。但這個(gè)威脅可信嗎?在一次性博弈中,一旦A選擇了下,B就沒(méi)辦法了,只有在0和1的收益中進(jìn)行理性選擇,只好有氣無(wú)力地選擇右啰。,©2011-13 王秋石,63/100,“先動(dòng)優(yōu)勢(shì)”,現(xiàn)在我們這樣思考:在此博弈中,如果由于種種原因,B為先動(dòng)者,均衡點(diǎn)又何在呢?它是否證明了所謂“先動(dòng)優(yōu)勢(shì)”?如果上例中的B先動(dòng),他會(huì)選擇左,然后A沒(méi)辦法,只好選擇上。先動(dòng)者得到了
38、9的收益,后動(dòng)時(shí)他只得到1。這就說(shuō)明了的確存在著所謂的“先動(dòng)優(yōu)勢(shì)”,即在序列博弈中,首先采取策略的選手通常得利更大。,©2011-13 王秋石,64/100,先動(dòng)優(yōu)勢(shì):斯塔克伯格解,用前一章學(xué)過(guò)的斯塔克伯格模型進(jìn)一步解釋先動(dòng)優(yōu)勢(shì)。需求曲線依然為 p=120-q,假定企業(yè)A為領(lǐng)導(dǎo)者,企業(yè)B為跟隨者,斯塔克伯格解為:q*A=60,q*B=30,p=30, πA =1800, πB=900。
39、現(xiàn)在以表11.8為基礎(chǔ),再加上斯塔克伯格解,我們得到下表:,©2011-13 王秋石,65/100,先動(dòng)優(yōu)勢(shì):斯塔克伯格解,©2011-13 王秋石,此博弈是否存在納什均衡呢?,如果A選30,B選40;如果A選40,B也選40;如果A選60,B選30。如果B選30,A選40;如果B選40,A也選40;如果B選60,A選30。這樣,兩個(gè)天真的跟隨者的產(chǎn)量(40,40)才是納什均衡。,,,,,,,,66/100,先動(dòng)優(yōu)
40、勢(shì):斯塔克伯格解,現(xiàn)假定A 為領(lǐng)導(dǎo)者,B 為跟隨者,把表11. 10 改為擴(kuò)展型的博弈樹(shù)。,©2011-13 王秋石,,,,,,,,,,■這三對(duì)策略都是子博弈的均衡。,67/100,先動(dòng)優(yōu)勢(shì):斯塔克伯格解,哪一個(gè)會(huì)成為整個(gè)博弈的均衡呢? 既然我先動(dòng),我選60啦,我的利潤(rùn)最大。,©2011-13 王秋石,,,,■斯塔克爾伯格的解為(A,B)= (60,30)=(1800,900)。,,68/100,幾個(gè)寡頭模型解的比較
41、,給定需求函數(shù)p=120-q,MC=0,E點(diǎn)(40,40)為古諾解SA(60,30)為A先動(dòng)的斯塔克伯格解,SB(30,60)為B先動(dòng)的斯塔克伯格解;C點(diǎn)(60,60)為競(jìng)爭(zhēng)性均衡;M點(diǎn)(30,30)為合謀性均衡。,©2011-13 王秋石,69/100,進(jìn)入威懾,在一些寡頭行業(yè),乃至壟斷行業(yè)中,總是存在著企業(yè)進(jìn)入的可能性。一般來(lái)說(shuō),誰(shuí)都希望自己是個(gè)壟斷者。因此,現(xiàn)有壟斷者總是會(huì)采取一些措施威懾新企業(yè)的進(jìn)入。有些威脅
42、是可信的,但也有些威脅是不可信的。潛在進(jìn)入者(定義為A)為先動(dòng)者,它有兩種選擇:進(jìn)入或放棄?,F(xiàn)有壟斷者(定義為B)為后動(dòng)者,它有兩種策略:一是降低價(jià)格實(shí)施反擊,二是不反擊。,©2011-13 王秋石,70/100,進(jìn)入威懾,©2011-13 王秋石,,■如果A不進(jìn)入,B也不反擊,這是事件的起點(diǎn),A和B的利潤(rùn)分別為0和8,這是最后一行。,71/100,進(jìn)入威懾,©2011-13 王秋石,,■如果A不進(jìn)入,B
43、還要反擊,這是一組沒(méi)有實(shí)際意義的策略組合,利潤(rùn)也假定同前,這是倒數(shù)第二行。,72/100,進(jìn)入威懾,©2011-13 王秋石,,■如果A選擇進(jìn)入,B發(fā)出威脅信號(hào),要以降價(jià)為手段反擊,(A,B)=(-1,4).,73/100,進(jìn)入威懾,©2011-13 王秋石,■如果A選擇進(jìn)入,B不反擊的收益為6,大于反擊時(shí)的4,它的威脅是不可信的。,■因此,A決定進(jìn)入。最后,均衡解為(A,B)=(進(jìn)入,不反擊)。,,74/100,不
44、可信威脅,在現(xiàn)實(shí)生活中,不可信威脅還是比較多見(jiàn)的。比如“老師,你不讓我及格我無(wú)臉見(jiàn)朋友我就跳樓”,“你不嫁給我,我就跟你同歸于盡”,“如果你硬要嫁給那臭小子,你就不是我的女兒,我也不是你爹”,“如果你要侵略我的盟國(guó),我就對(duì)你實(shí)施核打擊”等等。這里所講的“不可信”是在正常狀態(tài)對(duì)收益和成本比較所做出的一種理性判斷。但的確存在著一些非理性的人。這種人的威脅往往是成功的,可信的,這被稱(chēng)為“非理性的理性”。,©2011-13 王秋石,
45、75/100,愛(ài)的心語(yǔ),©2011-13 王秋石,如果你不買(mǎi)那件衣服給我,我就不給你燒飯。,76/100,可信的威脅,在本例中,現(xiàn)有壟斷者如何實(shí)現(xiàn)可信的承諾呢?其中一種辦法就是在潛在進(jìn)入者尚未考慮進(jìn)入之前,就做好了擴(kuò)大生產(chǎn)能力的物資準(zhǔn)備,一旦有潛在進(jìn)入者進(jìn)入,它就可以以更低的平均成本生產(chǎn)更多的產(chǎn)量,為打價(jià)格戰(zhàn)做好了充分的準(zhǔn)備。此時(shí),利潤(rùn)分配狀況會(huì)發(fā)生實(shí)質(zhì)變化。到時(shí)就別怪我不客氣。,©2011-13 王秋石,77/
46、100,可信的威脅,©2011-13 王秋石,,,,,78/100,可信的威脅,這種威脅可信嗎?如果A選擇進(jìn)入,B一定會(huì)選擇反擊。因?yàn)榉磽舻氖找鏋?,大于不反擊的收益2。一旦B反擊,A的利潤(rùn)為(-2)。如果A選擇不進(jìn)入,利潤(rùn)為零。那就不進(jìn)入吧!最后,A 選擇放棄進(jìn)入,B 威懾成功。生命的機(jī)會(huì)成本為零的人的威脅大多可行嗎?,©2011-13 王秋石,79/100,純粹策略,在上述博弈中,我們所考察的所有策略都是有
47、特定的策略或行動(dòng)的,例如,進(jìn)入或不進(jìn)入,承認(rèn)或否認(rèn),定價(jià)為3 元或?yàn)? 元等。這種選手采用特定策略的策略就是純粹策略。讓我們看一個(gè) “手心手背博弈”。,©2011-13 王秋石,80/100,手心手背博弈,給定A出手心,B的最佳策略是手背;給定A出手背,B的最佳策略是手心。,©2011-13 王秋石,■ 給定B出手心,A的最佳策略是手心;給定B出手背,A的最佳策略是手背。,,,,,■ 這里不存在任何一組策略使得
48、兩人都同時(shí)滿足,因此,沒(méi)有納什均衡。(不存在兩個(gè)同時(shí)所指的箭頭),81/100,混合策略,在純粹策略中,選手要么選手心,要么選手背;而在混合策略中,選手可以50%的概率出手心,50%的概率出手背;或者其他什么概率。這種基于一組選擇的概率對(duì)其結(jié)果進(jìn)行隨機(jī)選擇的策略就是混合策略。盡管從純粹策略而言,手心手背博弈不存在著納什均衡;但從混合策略上講,它是存在著納什均衡的。,©2011-13 王秋石,82/100,混合策略,如何求解
49、混合策略的納什均衡呢?納什均衡的實(shí)質(zhì)是:它必然是一個(gè)選手對(duì)另外一個(gè)選手最佳策略的一種最佳反應(yīng)。如果是你的最佳策略,但不是我的,這不是納什均衡;如果是我的最佳策略,但不是你的,這也不是納什均衡。只有兩個(gè)同時(shí)為最佳策略才為納什均衡。在選手A看來(lái),如果他選手心的概率幾乎為1,選手B幾乎選手背,但A對(duì)此的最佳反應(yīng)都是選手背,沒(méi)有均衡。同理,如果A選手心的概率幾乎為0(即更可能選手背),B的最佳選擇是手心,但A對(duì)此的最佳反應(yīng)又是手心,也沒(méi)有均
50、衡。,©2011-13 王秋石,83/100,混合策略,要使得這一博弈存在均衡的關(guān)鍵是A要選擇出手心的一個(gè)概率p(那么,出手背的概率便為1-p),使得對(duì)手B不會(huì)選擇一個(gè)確定性策略,而是對(duì)幾種選擇無(wú)差異。這樣,如果A以p的概率選手心,(1-p)的概率選手背,那么,B選手心的預(yù)期收益(或效用)等于:,©2011-13 王秋石,■ 同理,B選手背的預(yù)期效用等于:,84/100,混合策略,欲使B對(duì)選手心和手背的預(yù)期效用無(wú)差
51、異,就必須使得以上兩式相等, 1-2p=2p-1, p=1/2■ 即A以1/2的概率各出手心與手背,B在選擇手心手背之間無(wú)差異。 如果p>1/2,B從選擇手背中得到更大的效用; 如果p<1/2,B從選擇手心中得到更大的效用。,©2011-13 王秋石,85/100,混合策略,同理,選手B要選擇出手心的概率q(出手背的概率為1-q),
52、使得A在兩種選擇中無(wú)差異。這樣,A選手心的預(yù)期效用UE(手心)要恰好等于選手背的預(yù)期效用UE(手背),即:,©2011-13 王秋石,86/100,混合策略,即B以1/2的概率各出手心與手背,A在選擇手心和手背之間無(wú)差異。如果q>1/2,A從選擇手心中得到更大效用;如果q<1/2,A從選手背中得到更大效用。這樣,(這一策略組合p=1/2,q=1/2)便是混合策略的納什均衡。,©2011-13 王秋石
53、,87/100,混合策略,一般地說(shuō),一個(gè)2人和2種策略的博弈的收益矩陣以及相應(yīng)概率(p,q)可以寫(xiě)成表11.12。,©2011-13 王秋石,88/100,混合策略,混合策略的納什均衡必須滿足以下兩個(gè)條件:第一,A選擇S1A的概率為p時(shí),使得B選擇S1B和S2B無(wú)差異:,©2011-13 王秋石,第二,B選擇S1B的概率為q時(shí),使得A選擇S1A和S2A無(wú)差異:,89/100,混合策略,求解出p*和q*便是混合策略的
54、納什均衡。我們?yōu)槭裁匆紤]求解混合策略的納什均衡呢?原因之一就是有些博弈的純粹策略沒(méi)有納什均衡,然而,一旦允許玩混合策略,每一個(gè)博弈至少有一個(gè)納什均衡。因此,混合策略對(duì)沒(méi)有純粹策略納什均衡的博弈提供了一種解。這個(gè)解是否合理取決于具體的博弈。在上述博弈中,手心手背各隨機(jī)地出,其概率為1/2,你的效用就實(shí)現(xiàn)了極大化。,©2011-13 王秋石,90/100,性別沖突博弈,性別沖突博弈是既有純粹策略納什均衡,又有混合策略納什
55、均衡的一個(gè)例子。丈夫和妻子很想在某一個(gè)周六晚上呆在一起,但對(duì)娛樂(lè)的偏好不盡相同。妻子喜歡聽(tīng)音樂(lè)會(huì),丈夫偏愛(ài)看足球賽,同時(shí)這對(duì)新婚夫婦都認(rèn)為在一起的效用比單獨(dú)行動(dòng)的效用更大。,©2011-13 王秋石,91/100,性別沖突博弈,給定妻子看足球賽,丈夫的最佳選擇也是看足球賽,此時(shí)他最幸福,效用最大;給定妻子聽(tīng)音樂(lè)會(huì),丈夫的最佳選擇也是聽(tīng)音樂(lè)會(huì),因?yàn)樗憛捯蝗斯陋?dú)地看足球賽。,©2011-13 王秋石,,,給定丈夫看足
56、球賽,妻子的最佳選擇也是看足球賽(因?yàn)樗憛捯蝗斯陋?dú)地聽(tīng)音樂(lè)會(huì));給定丈夫聽(tīng)音樂(lè)會(huì),妻子的最佳選擇也是聽(tīng)音樂(lè)會(huì),而且,此時(shí)她最幸福,效用最大。,,,92/100,性別沖突博弈,這樣,從純粹策略上,此博弈有2 個(gè)納什均衡:(看足球賽,看足球賽),(聽(tīng)音樂(lè)會(huì),聽(tīng)音樂(lè)會(huì))。,©2011-13 王秋石,,,然而,誰(shuí)委屈誰(shuí)呢?大家來(lái)玩概率吧!,93/100,性別沖突博弈,這一博弈也存在著一組混合策略的納什均衡。參照上述方法,我們首先假
57、定丈夫看足球賽的概率為p,聽(tīng)音樂(lè)會(huì)的概率便為(1-p);妻子看足球賽的概率為q,聽(tīng)音樂(lè)會(huì)的概率便為(1-q)。欲求解最佳的p和q,我們要令妻子看足球賽和聽(tīng)音樂(lè)會(huì)無(wú)差異,就必須: 1×p+0×(1-p)=0×p+2×(1-p) 還要令丈夫在這兩者中無(wú)差異,有: 2×q+0× (1-q)=0×q+1× (1-q),
58、©2011-13 王秋石,94/100,性別沖突博弈,求解得知,p=2/3,q=1/3 為此博弈的混合策略的納什均衡?!龃私獾暮x是:如果夫妻倆不想采用確定性的行為,而想采取隨機(jī)性的行為,那么,可以丈夫2/3概率和妻子1/3的概率看足球賽確保夫妻倆的預(yù)期效用極大化。■當(dāng)然,同理,妻子2/3概率和丈夫1/3概率聽(tīng)音樂(lè)會(huì)也可以確保夫妻倆的預(yù)期效用極大化。,©2011-13 王秋石,95/100,婚姻保
59、衛(wèi)戰(zhàn),聽(tīng)音樂(lè)會(huì)還是看足球賽?這是個(gè)問(wèn)題。年輕時(shí)常相廝守,壯年時(shí)各干各的,年老是相互依伴。,©2011-13 王秋石,96/100,,,1.任何一個(gè)博弈都必須擁有5 個(gè)要素:(1)選手;(2) 規(guī)則;(3) 策略;(4) 收益;(5) 結(jié)果;2.分析一個(gè)博弈分成兩步:(1) 描述博弈;(2) 尋找均衡結(jié)果;3.優(yōu)勢(shì)策略均衡是納什均衡的一種特例;4.所謂囚犯困境是指這樣一種困惑不解的境界:納什均衡并非是帕累托最優(yōu)的,而帕
60、累托最優(yōu)的又不是納什均衡;5.囚犯困境可用于解釋類(lèi)似于“ 廣告困境”、“ 研發(fā)困境”、“ 產(chǎn)量困境”、“ 合作困境”等,其解釋力相當(dāng)強(qiáng);,本章小節(jié),,11 博弈論基礎(chǔ),©2011-13 王秋石,97/100,,,6.在重復(fù)性博弈中,以牙還牙策略有可能導(dǎo)致合作解。7. 最后一輪的重復(fù)性博弈結(jié)果與只有一輪的博弈結(jié)果相同,因此,有限次重復(fù)性博弈的結(jié)果與一次性博弈結(jié)果沒(méi)有兩樣。8. 在無(wú)限次重復(fù)性博弈中,以牙還牙策略可能獲得成功
61、。9. 無(wú)限次重復(fù)性博弈所形成的合作均衡并不是穩(wěn)定的。10. 斯塔克爾伯格模型較好地解釋了“ 先動(dòng)優(yōu)勢(shì)”。,本章小節(jié),,11 博弈論基礎(chǔ),©2011-13 王秋石,98/100,,,11. 有些壟斷者采取一些措施威脅新企業(yè)的進(jìn)入,有些威脅是不可信的。12. 當(dāng)現(xiàn)有壟斷者有足夠多的生產(chǎn)潛能時(shí),對(duì)進(jìn)入者的威脅往往變得更加可信了。13. 有些博弈在純粹策略上沒(méi)有納什均衡,但在混合策略上一定有納什均衡。,本章小節(jié),,11 博弈
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 微觀經(jīng)濟(jì)學(xué)作業(yè)12秋
- 《微觀經(jīng)濟(jì)學(xué)》
- 微觀經(jīng)濟(jì)學(xué)
- 微觀經(jīng)濟(jì)學(xué)
- 中級(jí)微觀經(jīng)濟(jì)學(xué)
- 微觀經(jīng)濟(jì)學(xué)教案
- 微觀經(jīng)濟(jì)學(xué)教案
- 微觀經(jīng)濟(jì)學(xué)題目
- 微觀經(jīng)濟(jì)學(xué)筆記
- 微觀經(jīng)濟(jì)學(xué) 題庫(kù)
- 高級(jí)微觀經(jīng)濟(jì)學(xué)
- 微觀經(jīng)濟(jì)學(xué)作業(yè)
- 微觀經(jīng)濟(jì)學(xué)試題
- 微觀經(jīng)濟(jì)學(xué)題庫(kù)
- 微觀經(jīng)濟(jì)學(xué)講義
- 微觀經(jīng)濟(jì)學(xué)錯(cuò)題
- 微觀經(jīng)濟(jì)學(xué)答案
- 微觀經(jīng)濟(jì)學(xué)解答
- 微觀經(jīng)濟(jì)學(xué)教案
- 微觀經(jīng)濟(jì)學(xué)題庫(kù)
評(píng)論
0/150
提交評(píng)論