秋石微觀經(jīng)濟(jì)學(xué)ch11

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-01-05 格式：pptx 頁(yè)數(shù)：100 大?。?.92MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁(yè)，還剩99頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、,,1.界定博弈論的一些基本概念；2.界定優(yōu)勢(shì)策略和納什均衡3.理解囚犯困境的含義及其應(yīng)用；4.推導(dǎo)重復(fù)性博弈的納什均衡；5.推導(dǎo)序列博弈的納什均衡；,本章要點(diǎn),,學(xué)完本章，你將能夠,11 博弈論基礎(chǔ),©2011-13 王秋石,2/100,,,6.理解為什么存在著先動(dòng)優(yōu)勢(shì)；7.理解進(jìn)入威懾的可信性問(wèn)題8.推導(dǎo)混合策略的納什均衡,本章要點(diǎn),,學(xué)完本章，你將能夠,11 博弈論基礎(chǔ),©2011-13 王秋石,3

2、/100,博弈就是一種比賽,©2011-13 王秋石,比賽可以比快，也可以比慢。,4/100,博弈論的基本概念,博弈論(game theory)：又稱(chēng)對(duì)策論，是用于分析策略性行為的一種工具。博弈的分析步驟第一步是尋找到某種有用的方式來(lái)描述這場(chǎng)博弈；第二步是尋找某種方式來(lái)預(yù)測(cè)結(jié)果。博弈的要素(1)選手；(2)規(guī)則；(3)策略；(4)收益；(5)結(jié)果。,©2011-13 王秋石,5/100,“剪子、石頭、布”的

3、博弈,該游戲有兩個(gè)選手(players)，即參與此博弈的行為者；每個(gè)選手有三種策略(strategies)可供選擇：1出剪子；2出石頭；3出布。通俗點(diǎn)說(shuō)，策略就是出招兒。該游戲有個(gè)規(guī)則:如果兩人出了相同的策略(如石頭對(duì)石頭等三種可能性)，雙方為打平；如果兩人出手不一(如石頭對(duì)剪子等六種可能性)，則可決定出勝負(fù)，石頭贏剪子、剪子贏布、布贏石頭(即石頭砸剪子、剪子剪布、布包石頭)。,©2011-13 王秋石,6/100,“剪子

4、、石頭、布”的博弈,在游戲之前，雙方達(dá)成獎(jiǎng)懲協(xié)議:如贏家賺1元，輸家輸1元；或者贏家不喝酒，而輸家罰酒一杯等等。假如是輸贏1元的協(xié)議，表(11.1)就是這個(gè)游戲的收益表(Payoff table)，把選手的收益狀況用表的形式描述，有時(shí)亦稱(chēng)收益矩陣(Payoff matrix)。,©2011-13 王秋石,7/100,收益表,如果A出石頭，B也出石頭，各自收益均為0；,©2011-13 王秋石,,,,,,,8/100

5、,收益表,如果A出石頭，B出剪子，A的收益為1，B的收益為(-1)；,©2011-13 王秋石,,,,,,,9/100,收益表,如果A出石頭，B出布，A的收益為(-1)，而B(niǎo)的收益為1。,©2011-13 王秋石,,,,,,,余此類(lèi)推,10/100,博弈論的基本概念,一般來(lái)說(shuō)，在每個(gè)小方框內(nèi)，第一個(gè)數(shù)據(jù)為排在左邊的選手A的收益，第二個(gè)數(shù)據(jù)為排在上方的選手B的收益，中間用逗號(hào)隔開(kāi)，即(A，B)=(0，0)等等。上表是

6、一種常見(jiàn)的用表格描述一場(chǎng)博弈的方法,簡(jiǎn)稱(chēng)常規(guī)式博弈(normal form)。同時(shí)博弈：要求選手同時(shí)出招的博弈。序列博弈: 選手可以分先后時(shí)間出招的博弈。,©2011-13 王秋石,11/100,優(yōu)勢(shì)策略,假定A、B 兩人在玩一個(gè)十分簡(jiǎn)單的博弈,A 在紙上可以寫(xiě)“上”或“下”,B 在另外一張紙上可以寫(xiě)“左”或“右”,其收益矩陣如下表所示。,©2011-13 王秋石,每個(gè)選手都是自我利益極大化者。,12/100,

7、優(yōu)勢(shì)策略,如果B選左，A選上的收益為1，而選下的收益為2，那么，A選下；,©2011-13 王秋石,,,,,,,,如果B選右，A在收益0與1之間選擇，A選擇下。,,,13/100,優(yōu)勢(shì)策略,優(yōu)勢(shì)策略:無(wú)論對(duì)方選擇什么策略，該選手總是選擇某種固定的策略，又稱(chēng)占優(yōu)策略。在本例中，無(wú)論B出什么招，A總是選下。因此，選下是A的優(yōu)勢(shì)策略。所謂優(yōu)勢(shì)策略，就是無(wú)論你出什么招，我就出這一招。選手B也有優(yōu)勢(shì)策略嗎？,©2011-

8、13 王秋石,14/100,優(yōu)勢(shì)策略,給定A選上，B選左的收益為1，而選右的收益為2，那么，B選左；,©2011-13 王秋石,,,如果A選下，B在收益0與1之間選擇， B選左。,,,,,,,,15/100,優(yōu)勢(shì)策略,無(wú)論選手A如何選擇，B將始終選擇左。B選擇左是優(yōu)勢(shì)策略。在某個(gè)博弈中,如果每個(gè)選手都有一種優(yōu)勢(shì)策略,那么,兩個(gè)選手的優(yōu)勢(shì)策略組合就是這一博弈的均衡。所謂博弈的均衡就是會(huì)發(fā)生的一種結(jié)局。,©2011

9、-13 王秋石,16/100,優(yōu)勢(shì)策略,在上例中，(A，B)=(下，左)=(2，1)就是該博弈優(yōu)勢(shì)策略的均衡結(jié)果。,©2011-13 王秋石,,17/100,優(yōu)勢(shì)策略,大學(xué)成功秘訣：不管你如何，我始終把努力學(xué)習(xí)作為我的優(yōu)勢(shì)策略。,©2011-13 王秋石,18/100,納什均衡,并非所有的博弈都存在優(yōu)勢(shì)策略均衡。,©2011-13 王秋石,在以下改進(jìn)的博弈中，如果B選左，A就選上；如果B選右，A就選下；

10、因此，A沒(méi)有優(yōu)勢(shì)策略。,,,,,？,,,19/100,納什均衡,同理可以分析，B也沒(méi)有優(yōu)勢(shì)策略。,©2011-13 王秋石,,,,,？,,那么該博弈是否存在著均衡呢？,,,20/100,納什均衡,優(yōu)勢(shì)策略均衡的要求也許太高了點(diǎn)。它要求無(wú)論B 出什么招,A 有一個(gè)優(yōu)勢(shì)策略;而且還要求無(wú)論A 出什么招,B 也有一個(gè)優(yōu)勢(shì)策略。這兩個(gè)優(yōu)勢(shì)策略的組合才構(gòu)成一個(gè)優(yōu)勢(shì)策略均衡。如果給定B 的選擇,A 的選擇是最佳的;同時(shí)給定A 的選擇,

11、B 的選擇也是最佳的,那么，A 和B 的這組最佳選擇的組合就是納什均衡。,©2011-13 王秋石,21/100,約翰?納什,這是以1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主、美國(guó)經(jīng)濟(jì)學(xué)家約翰·納什的名字命名的。瑞典皇家科學(xué)院的公報(bào)稱(chēng):“納什由于引入了合作博弈與非合作博弈的區(qū)分,并為非合作博弈創(chuàng)立了一種均衡概念。這種均衡概念現(xiàn)在被命名為‘ 納什均衡’”,©2011-13 王秋石,22/100,約翰·納什,納什

12、均衡,如果B 選左,A 的最佳選擇為上;,©2011-13 王秋石,,,,,如果B 選右,A 的最佳選擇為下;,如果A 選上,B 的最佳選擇為左;如果A 選下,B的最佳選擇為右。,,,,,兩箭頭所指就是納什均衡。,23/100,納什均衡,給定B 選左,A 的最佳選擇為上；給定A選擇上，B的最佳選擇為左；所以,(上，左)為納什均衡。,©2011-13 王秋石,同理,(下，右)為另一組納什均衡。,,,24/100,優(yōu)勢(shì)

13、均衡與納什均衡的聯(lián)系與區(qū)別,優(yōu)勢(shì)策略：無(wú)論你做什么，我做我最好的；無(wú)論我做什么，你做你最好的。納什均衡：給定你的策略，我做我最好的；給定我的策略，你做你最好的。由此可見(jiàn)，優(yōu)勢(shì)策略均衡便是納什均衡的一種特例。通俗地講，如果是優(yōu)勢(shì)策略均衡，就一定是納什均衡；反之，則不然。,©2011-13 王秋石,25/100,囚犯困境,有兩個(gè)嫌疑犯A和B因合伙偷竊自行車(chē)被警方捉拿歸案，且證據(jù)確鑿，可判他們每人各2年的徒刑。如果他倆都承認(rèn)犯

14、有搶劫銀行罪，當(dāng)局就以?xún)勺锊⒘P，各判10年監(jiān)禁；如果兩嫌疑犯都否認(rèn)犯有搶劫銀行罪，當(dāng)局則以偷自行車(chē)罪各判2年刑；如果一方承認(rèn)犯有搶劫銀行罪并提供有效證據(jù)，而另一方拒絕承認(rèn)的話，當(dāng)局以“坦白從寬，抗拒從嚴(yán)”的原則，對(duì)承認(rèn)犯罪者不再追究偷竊自行車(chē)罪而釋放，而對(duì)否認(rèn)者三罪并罰（偷自行車(chē)、搶劫銀行和不誠(chéng)實(shí)罪)投監(jiān)20年。,©2011-13 王秋石,26/100,囚犯困境,在這個(gè)游戲中，有兩個(gè)選手：囚犯A和B，每個(gè)選手均有兩種策略。承

15、認(rèn)或否認(rèn)犯有搶劫銀行罪，有可能出現(xiàn)四種結(jié)果，其收益矩陣如表11.4所示。表中第一列，如果A和B同時(shí)承認(rèn)犯罪各坐牢10年；如果A否認(rèn)犯罪，而B(niǎo)承認(rèn)犯罪，A坐牢20年，而B(niǎo)卻可自由，表的第二列依此類(lèi)推。,©2011-13 王秋石,27/100,囚犯困境,對(duì)策論的一個(gè)中心問(wèn)題如果我相信我的對(duì)手是理性的，我如何給定他的行為做出我的一個(gè)最優(yōu)決策，即給定對(duì)手行為，我如何做出最佳選擇。這個(gè)對(duì)策存在著均衡嗎？,©2011-13

16、王秋石,28/100,囚犯困境,給定對(duì)方承認(rèn)，你也承認(rèn)；給定對(duì)方否認(rèn)，你承認(rèn)。（承認(rèn)，承認(rèn)）=（-10，-10）就是是優(yōu)勢(shì)策略均衡；于是(承認(rèn)，承認(rèn))也是囚犯困境的納什均衡。,©2011-13 王秋石,,,,,,29/100,囚犯困境,為什么把它稱(chēng)為“囚犯困境” 呢？(承認(rèn)，承認(rèn))=(-10，-10)是納什均衡。如果他們都否認(rèn)犯罪，每人只需坐牢2年，而不是10年。(否認(rèn)，否認(rèn)）是一種帕累托效率，而(承認(rèn)，承認(rèn))一種帕累托

17、非效率。囚犯困境的“困惑”就在于為什么納什均衡并非是帕累托最優(yōu)，而帕累托效率又不是納什均衡的結(jié)果呢？,©2011-13 王秋石,30/100,囚犯困境及其應(yīng)用,囚犯困境隱含著，合謀也許是一個(gè)更為有效的結(jié)果。囚犯困境是在向看不見(jiàn)手的挑戰(zhàn)。亞當(dāng).斯密的看不見(jiàn)的手理論認(rèn)為，市場(chǎng)經(jīng)濟(jì)中的每個(gè)人都在追求自我利益，但在追求自我利益的過(guò)程中同時(shí)也實(shí)現(xiàn)了社會(huì)的公共利益。囚犯困境卻揭示社會(huì)中的每個(gè)人都在追求自我利益，然而，人類(lèi)社會(huì)的公共利

18、益卻不可能實(shí)現(xiàn)。,©2011-13 王秋石,31/100,囚犯困境一種表現(xiàn),©2011-13 王秋石,32/100,你急我急大家急急成一團(tuán)（請(qǐng)對(duì)下聯(lián)）,廣告困境,做廣告導(dǎo)致需求增加，將激勵(lì)企業(yè)大量做廣告。其一，廣告之后，原本沒(méi)使用過(guò)本產(chǎn)品的人了解了產(chǎn)品，其中一部分可能購(gòu)買(mǎi)之；其二，一些在使用其它同類(lèi)品牌的人可能轉(zhuǎn)換過(guò)來(lái)消費(fèi)本產(chǎn)品。現(xiàn)假定有兩家寡頭面臨著兩個(gè)選擇：（大量）做廣告和不（大量）做廣告。在現(xiàn)實(shí)經(jīng)濟(jì)中，

19、他們要選擇做多少?gòu)V告的問(wèn)題。為了簡(jiǎn)化起見(jiàn)，也不失一般性，就假定只有這兩種選擇。,©2011-13 王秋石,33/100,可口可樂(lè)與百事可樂(lè)之爭(zhēng),©2011-13 王秋石,34/100,可口可樂(lè)與百事可樂(lè)之爭(zhēng),©2011-13 王秋石,35/100,廣告困境之一,無(wú)論A如何，B始終要做廣告，做廣告是B的優(yōu)勢(shì)策略；同理，做廣告也是A的優(yōu)勢(shì)策略。,©2011-13 王秋石,,,,,■因此，(做廣告，做廣

20、告)=(300，300)便成為此博弈的優(yōu)勢(shì)策略均衡，同時(shí)也是納什均衡。,,36/100,廣告困境之二,企業(yè)B 的優(yōu)勢(shì)策略是做廣告,而企業(yè)A 卻沒(méi)有優(yōu)勢(shì)策略。如果B做廣告,A 最好跟著做廣告;但如果B 不做廣告,A 最好的策略也是不做廣告。,©2011-13 王秋石,,,,,37/100,廣告困境,因此，(做廣告，做廣告)=(200，300)依然是納什均衡。,©2011-13 王秋石,,,,■但是，(不做廣告，不做廣告

21、)=(500，600)卻是一種帕累托最優(yōu)，但對(duì)這種非合作性博弈就偏偏實(shí)現(xiàn)不了。,,38/100,禁播香煙廣告的法案,1971 年1 月1 日,美國(guó)眾議院通過(guò)了禁止在電視上播出香煙廣告的法案.但法案的制定者當(dāng)初并不知道它有利于解決香煙廣告困境問(wèn)題。它使得美國(guó)煙草制造商們花在香煙上的廣告費(fèi)從此法案實(shí)施前一年的3 億美元下降到了實(shí)施后一年的6 000 多萬(wàn)美元,這其中大部分都轉(zhuǎn)化為煙草行業(yè)的利潤(rùn)了。,©2011-13 王秋石,3

22、9/100,研發(fā)博弈,研發(fā)是指企業(yè)研究新技術(shù)、開(kāi)發(fā)新產(chǎn)品的活動(dòng)?，F(xiàn)假定有兩個(gè)實(shí)力相當(dāng)?shù)墓杨^在兩大策略中選擇研發(fā)和不研發(fā)，其假定的收益矩陣如表11.7所示。,©2011-13 王秋石,,,,,40/100,研發(fā)博弈,寡頭A 和寡頭B 都存在著一種優(yōu)勢(shì)策略——研發(fā),所以,(研發(fā),研發(fā))成為本博弈中的納什均衡。其實(shí),雙方達(dá)到合謀都不研發(fā)或者少研發(fā)是一種帕累托改進(jìn)。,©2011-13 王秋石,,,41/100,產(chǎn)量困境:古

23、諾解,我們?cè)诘?0章介紹古諾模型時(shí)假設(shè)，有兩家寡頭生產(chǎn)同質(zhì)的礦泉水，每家寡頭的邊際成本為零，其共同的市場(chǎng)需求曲線為: p=120-q■企業(yè)A和企業(yè)B的數(shù)量反應(yīng)函數(shù)分別為:,©2011-13 王秋石,■求解古諾解為：,42/100,產(chǎn)量困境:古諾解,如果兩家組成卡特爾，像一個(gè)壟斷者那樣生產(chǎn)，那么,MR=MC=0,平分市場(chǎng)后有：,©2011-13 王秋石,■如果A 生產(chǎn)30,但B 違

24、約生產(chǎn)40,這樣,p =50,πA =1 500, πB =2 000,因此,B 有違約的激勵(lì)。,■同理,如果B 生產(chǎn)30,但A 違約生產(chǎn)40,這樣p = 50, πA = 2 000, πB =1 500,因此,A 有違約的激勵(lì)。,43/100,產(chǎn)量困境:古諾解,把上述情況用利潤(rùn)矩陣描述成下表。,©2011-13 王秋石,44/100,產(chǎn)量困境:古諾解,給定B合作，A違約，給定B違約，A違約；,©2011-13 王

25、秋石,,,,,給定A合作，B違約，給定A違約，B違約；,45/100,產(chǎn)量困境:古諾解,（違約，違約）=（1600,1600）成為納什均衡。,©2011-13 王秋石,,,,■合謀性壟斷產(chǎn)量(各為30)使得雙方利潤(rùn)都更高（1800,1800），但它不是一種納什均衡。,,46/100,囚犯困境及其應(yīng)用,以上幾個(gè)例子都有一個(gè)共同特征:合作性博弈的解優(yōu)越于非合作性博弈，但合作又不是納什均衡。在現(xiàn)實(shí)生活中畢竟有一些(短暫)合作成功的

26、案例。《核武器不擴(kuò)散條件》、《有核國(guó)家不首先使用核武器條約》，甚至《兩國(guó)導(dǎo)彈互不對(duì)準(zhǔn)條約》。在現(xiàn)實(shí)生活中，有些囚犯就是不承認(rèn)犯罪，原因是這些博弈不是玩一次，而是在重復(fù)性地玩。,©2011-13 王秋石,47/100,重復(fù)性博弈,在現(xiàn)實(shí)生活中,寡頭間關(guān)于彼此產(chǎn)量和價(jià)格的決策遠(yuǎn)不止一次,他們根據(jù)對(duì)手的行為在不斷地調(diào)整自己的產(chǎn)量和價(jià)格。這種不斷調(diào)整其策略并改變收益的博弈被稱(chēng)為重復(fù)性博弈。當(dāng)囚犯困境的雙方只能進(jìn)行一次性博弈時(shí)，很

27、難進(jìn)行有效的懲罰；而在重復(fù)性博弈時(shí)，有效的懲罰對(duì)方或者威脅對(duì)方就成為可能了。重復(fù)性博弈——擺脫囚犯困境。,©2011-13 王秋石,48/100,重復(fù)性博弈,20 世紀(jì)60 年代進(jìn)行的實(shí)驗(yàn)性研究尋找到了一種簡(jiǎn)單的辦法——以牙還牙(tit-for-tat)策略——能夠有效地讓意欲違約者保持克制。以牙還牙策略是指在重復(fù)性博弈過(guò)程中某一選手對(duì)對(duì)方在前一期的合作同樣也采取合作的態(tài)度，對(duì)對(duì)方不合作則采取報(bào)復(fù)性的策略。在囚犯困境的重

28、復(fù)性博弈中，大家都清楚地知道，合作的巨大收益提供了合作的正面激勵(lì)，對(duì)方的有效威脅和潛在傷害則提供了合作的負(fù)面激勵(lì)。,©2011-13 王秋石,49/100,重復(fù)性博弈：價(jià)格,在固定價(jià)格的一次性博弈中，哪怕有約在先，雙方都保持壟斷價(jià)格同時(shí)分享市場(chǎng)需求，最后的均衡為各自采用競(jìng)爭(zhēng)性?xún)r(jià)格獲得零經(jīng)濟(jì)利潤(rùn)。但在重復(fù)性博弈中，情況有所不同。雙方知道，如果我降價(jià)，對(duì)方一定會(huì)降價(jià)，可能降得還更慘，對(duì)方要置我于死地而后快；如果我采取合作態(tài)度，對(duì)

29、方很可能也會(huì)合作。為什么我不首先采取合作態(tài)度——把價(jià)格定在壟斷價(jià)格呢？,©2011-13 王秋石,50/100,重復(fù)性博弈：日常生活,在公交車(chē)上，我們很少為素不相識(shí)的乘客買(mǎi)車(chē)票，因?yàn)檫@大凡是一次性博弈。而我們很可能為朋友買(mǎi)車(chē)票，我們與朋友的交往是重復(fù)性博弈。如果他是個(gè)吝嗇鬼，你可以選擇不與他同車(chē)等。在重復(fù)性博弈中，每個(gè)人都比較關(guān)心自己的聲譽(yù)，正是這種聲譽(yù)機(jī)制使得人們大量采取合作性策略。,©2011-13 王秋石

30、,51/100,重復(fù)性博弈：軍事合作,牙還牙策略在軍事上也有所表現(xiàn)?！队泻藝?guó)家首先不使用核武器的協(xié)議》到目前為止遵守得很好的原因就是這個(gè)以牙還牙策略。但是，《兩國(guó)導(dǎo)彈互不對(duì)準(zhǔn)協(xié)議》遵循得就會(huì)差一些，兩國(guó)關(guān)系一旦惡化，很有可能都在暗地里違約。,©2011-13 王秋石,52/100,重復(fù)性博弈：戰(zhàn)地醫(yī)院,以牙還牙策略可以使戰(zhàn)地醫(yī)院享受愛(ài)情的浪漫。如果你專(zhuān)門(mén)轟炸對(duì)方的戰(zhàn)地醫(yī)院，你自己的醫(yī)院也就處于危險(xiǎn)之中。如果你打我的戰(zhàn)地

31、醫(yī)院，我絕對(duì)要以牙還牙，報(bào)仇雪恨。以上這些對(duì)人類(lèi)行為的觀察能夠幫助我們更好地認(rèn)識(shí)人類(lèi)的行為方式。,©2011-13 王秋石,53/100,重復(fù)性博弈,以牙還牙策略能否成功實(shí)施取決于博弈的次數(shù)。我們將重復(fù)性博弈按次數(shù)分類(lèi)為有限次重復(fù)性博弈和無(wú)限次重復(fù)性博弈。有限次重復(fù)性博弈就是未來(lái)博弈的次數(shù)已經(jīng)確定的博弈，也被稱(chēng)為固定次數(shù)的重復(fù)性博弈。無(wú)限次重復(fù)性博弈就是可以無(wú)限次數(shù)地、重復(fù)性地玩的一種博弈。,©2011-13

32、王秋石,54/100,有限次重復(fù)性博弈,假定我們知道囚犯困境博弈只玩十次，現(xiàn)在就是最后一次，結(jié)果會(huì)如何呢？最后玩的那次博弈就像只玩一次的博弈。因此，兩者的結(jié)果應(yīng)該是相同的。第九輪會(huì)如何呢？我們已知在第十輪雙方都會(huì)承認(rèn)犯罪，為什么在第九輪就要合作呢？同理，第八輪、第七輪……都會(huì)出現(xiàn)只玩一次博弈的納什均衡。只要這一博弈重復(fù)的次數(shù)已知，每一輪的結(jié)果都是原納什均衡的結(jié)果。,©2011-13 王秋石,55/100,無(wú)限次重復(fù)性博弈

33、,以牙還牙策略只有在無(wú)限次重復(fù)性博弈中才能有效。歐佩克（OPEC）是一個(gè)合作比較成功的卡特爾組織，其原因之一就是無(wú)限次重復(fù)性博弈所隱含的各種懲罰機(jī)制。無(wú)限次重復(fù)性博弈所形成的合作均衡解并不是穩(wěn)定的，它較為容易被打破。,©2011-13 王秋石,56/100,序列博弈,到目前為止所討論的博弈都是兩個(gè)選手要同時(shí)選擇策略。例如，在古諾模型中，兩家企業(yè)同時(shí)決定產(chǎn)量。在序列博弈中，選手們按先后順序進(jìn)行選擇。因此，序列博弈就是選手依

34、次出招的博弈。斯坦伯格模型就是序列博弈的一個(gè)例子，一企業(yè)是領(lǐng)導(dǎo)者，率先決定其產(chǎn)量，另一企業(yè)是跟隨者，相應(yīng)決定其產(chǎn)量。,©2011-13 王秋石,57/100,序列博弈,經(jīng)過(guò)分析,我們知道該博弈有兩個(gè)納什均衡:(上,左)和(下,右)。但是,我們將說(shuō)明其中的一個(gè)均衡不大合理。,©2011-13 王秋石,,,58/100,擴(kuò)展型博弈,圖11. 1 是表11. 9 中的博弈的擴(kuò)展型博弈，它有些像樹(shù)狀,故被稱(chēng)為博弈樹(shù)。因此

35、,用博弈樹(shù)表示的博弈被稱(chēng)為擴(kuò)展型,用表格所表示的博弈被稱(chēng)為常規(guī)型。,©2011-13 王秋石,59/100,擴(kuò)展型博弈,,©2011-13 王秋石,■如何求解擴(kuò)展型博弈的納什均衡呢？,■ 假定A已經(jīng)選擇了上，B一定會(huì)選擇左，收益為（1，9）；,,,,,,,■ 但如果A選擇下，B只好選擇右，收益為（2，1）。,60/100,擴(kuò)展型博弈,,©2011-13 王秋石,A是先動(dòng)者，在信息完備時(shí)，當(dāng)他看到博弈樹(shù)端點(diǎn)的

36、收益情況后，他一定會(huì)選擇下。,這樣（上，左）就不再是一個(gè)合理的均衡了。從擴(kuò)展型博弈看，（下，右）是唯一的納什均衡。,,,,,61/100,“先動(dòng)優(yōu)勢(shì)”,A好開(kāi)心，他享受到了“先動(dòng)優(yōu)勢(shì)”。一步為先，步步為先。再看看選手B，他有些可憐，他本可享受9，最后只好收益為1。他要看人家的臉色行事。,©2011-13 王秋石,62/100,“先動(dòng)優(yōu)勢(shì)”,當(dāng)然，他可以向A發(fā)出威脅：如果A選下，他報(bào)復(fù)性地選左，兩人都同歸于盡，各自收益為零。

37、如果A相信B會(huì)實(shí)施威脅，A只好選擇上，這樣，A的收益至少為1，而不是零。但這個(gè)威脅可信嗎？在一次性博弈中，一旦A選擇了下，B就沒(méi)辦法了，只有在0和1的收益中進(jìn)行理性選擇，只好有氣無(wú)力地選擇右啰。,©2011-13 王秋石,63/100,“先動(dòng)優(yōu)勢(shì)”,現(xiàn)在我們這樣思考:在此博弈中，如果由于種種原因，B為先動(dòng)者，均衡點(diǎn)又何在呢？它是否證明了所謂“先動(dòng)優(yōu)勢(shì)”？如果上例中的B先動(dòng)，他會(huì)選擇左，然后A沒(méi)辦法，只好選擇上。先動(dòng)者得到了

38、9的收益，后動(dòng)時(shí)他只得到1。這就說(shuō)明了的確存在著所謂的“先動(dòng)優(yōu)勢(shì)”，即在序列博弈中，首先采取策略的選手通常得利更大。,©2011-13 王秋石,64/100,先動(dòng)優(yōu)勢(shì)：斯塔克伯格解,用前一章學(xué)過(guò)的斯塔克伯格模型進(jìn)一步解釋先動(dòng)優(yōu)勢(shì)。需求曲線依然為 p=120-q，假定企業(yè)A為領(lǐng)導(dǎo)者，企業(yè)B為跟隨者，斯塔克伯格解為：q*A=60，q*B=30，p=30， πA =1800， πB=900。

39、現(xiàn)在以表11.8為基礎(chǔ)，再加上斯塔克伯格解，我們得到下表：,©2011-13 王秋石,65/100,先動(dòng)優(yōu)勢(shì)：斯塔克伯格解,©2011-13 王秋石,此博弈是否存在納什均衡呢？,如果A選30，B選40；如果A選40，B也選40；如果A選60，B選30。如果B選30，A選40；如果B選40，A也選40；如果B選60，A選30。這樣，兩個(gè)天真的跟隨者的產(chǎn)量（40，40）才是納什均衡。,,,,,,,,66/100,先動(dòng)優(yōu)

40、勢(shì)：斯塔克伯格解,現(xiàn)假定A 為領(lǐng)導(dǎo)者,B 為跟隨者,把表11. 10 改為擴(kuò)展型的博弈樹(shù)。,©2011-13 王秋石,,,,,,,,,,■這三對(duì)策略都是子博弈的均衡。,67/100,先動(dòng)優(yōu)勢(shì)：斯塔克伯格解,哪一個(gè)會(huì)成為整個(gè)博弈的均衡呢? 既然我先動(dòng),我選60啦，我的利潤(rùn)最大。,©2011-13 王秋石,,,,■斯塔克爾伯格的解為(A,B)= (60,30)=（1800，900）。,,68/100,幾個(gè)寡頭模型解的比較

41、,給定需求函數(shù)p=120-q，MC=0，E點(diǎn)（40，40）為古諾解SA（60，30）為A先動(dòng)的斯塔克伯格解，SB（30，60）為B先動(dòng)的斯塔克伯格解；C點(diǎn)（60，60）為競(jìng)爭(zhēng)性均衡；M點(diǎn)（30，30）為合謀性均衡。,©2011-13 王秋石,69/100,進(jìn)入威懾,在一些寡頭行業(yè)，乃至壟斷行業(yè)中，總是存在著企業(yè)進(jìn)入的可能性。一般來(lái)說(shuō)，誰(shuí)都希望自己是個(gè)壟斷者。因此，現(xiàn)有壟斷者總是會(huì)采取一些措施威懾新企業(yè)的進(jìn)入。有些威脅

42、是可信的，但也有些威脅是不可信的。潛在進(jìn)入者(定義為A)為先動(dòng)者,它有兩種選擇:進(jìn)入或放棄?，F(xiàn)有壟斷者(定義為B)為后動(dòng)者,它有兩種策略:一是降低價(jià)格實(shí)施反擊,二是不反擊。,©2011-13 王秋石,70/100,進(jìn)入威懾,©2011-13 王秋石,,■如果A不進(jìn)入，B也不反擊，這是事件的起點(diǎn)，A和B的利潤(rùn)分別為0和8，這是最后一行。,71/100,進(jìn)入威懾,©2011-13 王秋石,,■如果A不進(jìn)入，B

43、還要反擊，這是一組沒(méi)有實(shí)際意義的策略組合，利潤(rùn)也假定同前，這是倒數(shù)第二行。,72/100,進(jìn)入威懾,©2011-13 王秋石,,■如果A選擇進(jìn)入，B發(fā)出威脅信號(hào)，要以降價(jià)為手段反擊，（A,B）=(-1,4).,73/100,進(jìn)入威懾,©2011-13 王秋石,■如果A選擇進(jìn)入，B不反擊的收益為6，大于反擊時(shí)的4，它的威脅是不可信的。,■因此，A決定進(jìn)入。最后，均衡解為(A，B)=(進(jìn)入，不反擊)。,,74/100,不

44、可信威脅,在現(xiàn)實(shí)生活中，不可信威脅還是比較多見(jiàn)的。比如“老師，你不讓我及格我無(wú)臉見(jiàn)朋友我就跳樓”，“你不嫁給我，我就跟你同歸于盡”，“如果你硬要嫁給那臭小子，你就不是我的女兒，我也不是你爹”，“如果你要侵略我的盟國(guó)，我就對(duì)你實(shí)施核打擊”等等。這里所講的“不可信”是在正常狀態(tài)對(duì)收益和成本比較所做出的一種理性判斷。但的確存在著一些非理性的人。這種人的威脅往往是成功的，可信的，這被稱(chēng)為“非理性的理性”。,©2011-13 王秋石,

45、75/100,愛(ài)的心語(yǔ),©2011-13 王秋石,如果你不買(mǎi)那件衣服給我，我就不給你燒飯。,76/100,可信的威脅,在本例中，現(xiàn)有壟斷者如何實(shí)現(xiàn)可信的承諾呢？其中一種辦法就是在潛在進(jìn)入者尚未考慮進(jìn)入之前，就做好了擴(kuò)大生產(chǎn)能力的物資準(zhǔn)備，一旦有潛在進(jìn)入者進(jìn)入，它就可以以更低的平均成本生產(chǎn)更多的產(chǎn)量，為打價(jià)格戰(zhàn)做好了充分的準(zhǔn)備。此時(shí)，利潤(rùn)分配狀況會(huì)發(fā)生實(shí)質(zhì)變化。到時(shí)就別怪我不客氣。,©2011-13 王秋石,77/

46、100,可信的威脅,©2011-13 王秋石,,,,,78/100,可信的威脅,這種威脅可信嗎？如果A選擇進(jìn)入，B一定會(huì)選擇反擊。因?yàn)榉磽舻氖找鏋?，大于不反擊的收益2。一旦B反擊，A的利潤(rùn)為（-2）。如果A選擇不進(jìn)入，利潤(rùn)為零。那就不進(jìn)入吧！最后,A 選擇放棄進(jìn)入,B 威懾成功。生命的機(jī)會(huì)成本為零的人的威脅大多可行嗎？,©2011-13 王秋石,79/100,純粹策略,在上述博弈中,我們所考察的所有策略都是有

47、特定的策略或行動(dòng)的,例如,進(jìn)入或不進(jìn)入,承認(rèn)或否認(rèn),定價(jià)為3 元或?yàn)? 元等。這種選手采用特定策略的策略就是純粹策略。讓我們看一個(gè) “手心手背博弈”。,©2011-13 王秋石,80/100,手心手背博弈,給定A出手心，B的最佳策略是手背；給定A出手背，B的最佳策略是手心。,©2011-13 王秋石,■ 給定B出手心，A的最佳策略是手心；給定B出手背，A的最佳策略是手背。,,,,,■ 這里不存在任何一組策略使得

48、兩人都同時(shí)滿足，因此，沒(méi)有納什均衡。（不存在兩個(gè)同時(shí)所指的箭頭）,81/100,混合策略,在純粹策略中，選手要么選手心，要么選手背；而在混合策略中，選手可以50%的概率出手心，50%的概率出手背；或者其他什么概率。這種基于一組選擇的概率對(duì)其結(jié)果進(jìn)行隨機(jī)選擇的策略就是混合策略。盡管從純粹策略而言，手心手背博弈不存在著納什均衡；但從混合策略上講，它是存在著納什均衡的。,©2011-13 王秋石,82/100,混合策略,如何求解

49、混合策略的納什均衡呢？納什均衡的實(shí)質(zhì)是：它必然是一個(gè)選手對(duì)另外一個(gè)選手最佳策略的一種最佳反應(yīng)。如果是你的最佳策略，但不是我的，這不是納什均衡；如果是我的最佳策略，但不是你的，這也不是納什均衡。只有兩個(gè)同時(shí)為最佳策略才為納什均衡。在選手A看來(lái)，如果他選手心的概率幾乎為1，選手B幾乎選手背，但A對(duì)此的最佳反應(yīng)都是選手背，沒(méi)有均衡。同理，如果A選手心的概率幾乎為0（即更可能選手背），B的最佳選擇是手心，但A對(duì)此的最佳反應(yīng)又是手心，也沒(méi)有均

50、衡。,©2011-13 王秋石,83/100,混合策略,要使得這一博弈存在均衡的關(guān)鍵是A要選擇出手心的一個(gè)概率p（那么，出手背的概率便為1-p），使得對(duì)手B不會(huì)選擇一個(gè)確定性策略，而是對(duì)幾種選擇無(wú)差異。這樣，如果A以p的概率選手心，（1-p）的概率選手背，那么，B選手心的預(yù)期收益（或效用）等于：,©2011-13 王秋石,■ 同理，B選手背的預(yù)期效用等于：,84/100,混合策略,欲使B對(duì)選手心和手背的預(yù)期效用無(wú)差

52、使得A在兩種選擇中無(wú)差異。這樣，A選手心的預(yù)期效用UE（手心）要恰好等于選手背的預(yù)期效用UE（手背），即：,©2011-13 王秋石,86/100,混合策略,即B以1/2的概率各出手心與手背，A在選擇手心和手背之間無(wú)差異。如果q>1/2，A從選擇手心中得到更大效用；如果q<1/2，A從選手背中得到更大效用。這樣，（這一策略組合p=1/2，q=1/2）便是混合策略的納什均衡。,©2011-13 王秋石

53、,87/100,混合策略,一般地說(shuō)，一個(gè)2人和2種策略的博弈的收益矩陣以及相應(yīng)概率（p，q）可以寫(xiě)成表11.12。,©2011-13 王秋石,88/100,混合策略,混合策略的納什均衡必須滿足以下兩個(gè)條件：第一，A選擇S1A的概率為p時(shí)，使得B選擇S1B和S2B無(wú)差異：,©2011-13 王秋石,第二，B選擇S1B的概率為q時(shí)，使得A選擇S1A和S2A無(wú)差異：,89/100,混合策略,求解出p*和q*便是混合策略的

54、納什均衡。我們?yōu)槭裁匆紤]求解混合策略的納什均衡呢？原因之一就是有些博弈的純粹策略沒(méi)有納什均衡，然而，一旦允許玩混合策略，每一個(gè)博弈至少有一個(gè)納什均衡。因此，混合策略對(duì)沒(méi)有純粹策略納什均衡的博弈提供了一種解。這個(gè)解是否合理取決于具體的博弈。在上述博弈中，手心手背各隨機(jī)地出，其概率為1/2，你的效用就實(shí)現(xiàn)了極大化。,©2011-13 王秋石,90/100,性別沖突博弈,性別沖突博弈是既有純粹策略納什均衡，又有混合策略納什

55、均衡的一個(gè)例子。丈夫和妻子很想在某一個(gè)周六晚上呆在一起，但對(duì)娛樂(lè)的偏好不盡相同。妻子喜歡聽(tīng)音樂(lè)會(huì)，丈夫偏愛(ài)看足球賽，同時(shí)這對(duì)新婚夫婦都認(rèn)為在一起的效用比單獨(dú)行動(dòng)的效用更大。,©2011-13 王秋石,91/100,性別沖突博弈,給定妻子看足球賽，丈夫的最佳選擇也是看足球賽，此時(shí)他最幸福，效用最大；給定妻子聽(tīng)音樂(lè)會(huì)，丈夫的最佳選擇也是聽(tīng)音樂(lè)會(huì)，因?yàn)樗憛捯蝗斯陋?dú)地看足球賽。,©2011-13 王秋石,,,給定丈夫看足

56、球賽，妻子的最佳選擇也是看足球賽（因?yàn)樗憛捯蝗斯陋?dú)地聽(tīng)音樂(lè)會(huì)）；給定丈夫聽(tīng)音樂(lè)會(huì)，妻子的最佳選擇也是聽(tīng)音樂(lè)會(huì)，而且，此時(shí)她最幸福，效用最大。,,,92/100,性別沖突博弈,這樣,從純粹策略上,此博弈有2 個(gè)納什均衡:(看足球賽,看足球賽),(聽(tīng)音樂(lè)會(huì),聽(tīng)音樂(lè)會(huì))。,©2011-13 王秋石,,,然而，誰(shuí)委屈誰(shuí)呢？大家來(lái)玩概率吧！,93/100,性別沖突博弈,這一博弈也存在著一組混合策略的納什均衡。參照上述方法，我們首先假

57、定丈夫看足球賽的概率為p，聽(tīng)音樂(lè)會(huì)的概率便為（1-p）；妻子看足球賽的概率為q，聽(tīng)音樂(lè)會(huì)的概率便為（1-q）。欲求解最佳的p和q，我們要令妻子看足球賽和聽(tīng)音樂(lè)會(huì)無(wú)差異，就必須： 1×p+0×(1-p)=0×p+2×(1-p) 還要令丈夫在這兩者中無(wú)差異，有： 2×q+0× (1-q)=0×q+1× (1-q),

58、©2011-13 王秋石,94/100,性別沖突博弈,求解得知，p=2/3，q=1/3 為此博弈的混合策略的納什均衡?！龃私獾暮x是：如果夫妻倆不想采用確定性的行為，而想采取隨機(jī)性的行為，那么，可以丈夫2/3概率和妻子1/3的概率看足球賽確保夫妻倆的預(yù)期效用極大化。■當(dāng)然，同理，妻子2/3概率和丈夫1/3概率聽(tīng)音樂(lè)會(huì)也可以確保夫妻倆的預(yù)期效用極大化。,©2011-13 王秋石,95/100,婚姻保

59、衛(wèi)戰(zhàn),聽(tīng)音樂(lè)會(huì)還是看足球賽？這是個(gè)問(wèn)題。年輕時(shí)常相廝守，壯年時(shí)各干各的，年老是相互依伴。,©2011-13 王秋石,96/100,,,1.任何一個(gè)博弈都必須擁有5 個(gè)要素:(1)選手;(2) 規(guī)則;(3) 策略;(4) 收益;(5) 結(jié)果;2.分析一個(gè)博弈分成兩步:(1) 描述博弈;(2) 尋找均衡結(jié)果;3.優(yōu)勢(shì)策略均衡是納什均衡的一種特例;4.所謂囚犯困境是指這樣一種困惑不解的境界:納什均衡并非是帕累托最優(yōu)的,而帕

60、累托最優(yōu)的又不是納什均衡;5.囚犯困境可用于解釋類(lèi)似于“ 廣告困境”、“ 研發(fā)困境”、“ 產(chǎn)量困境”、“ 合作困境”等,其解釋力相當(dāng)強(qiáng);,本章小節(jié),,11 博弈論基礎(chǔ),©2011-13 王秋石,97/100,,,6.在重復(fù)性博弈中,以牙還牙策略有可能導(dǎo)致合作解。7. 最后一輪的重復(fù)性博弈結(jié)果與只有一輪的博弈結(jié)果相同,因此,有限次重復(fù)性博弈的結(jié)果與一次性博弈結(jié)果沒(méi)有兩樣。8. 在無(wú)限次重復(fù)性博弈中,以牙還牙策略可能獲得成功

61、。9. 無(wú)限次重復(fù)性博弈所形成的合作均衡并不是穩(wěn)定的。10. 斯塔克爾伯格模型較好地解釋了“ 先動(dòng)優(yōu)勢(shì)”。,本章小節(jié),,11 博弈論基礎(chǔ),©2011-13 王秋石,98/100,,,11. 有些壟斷者采取一些措施威脅新企業(yè)的進(jìn)入,有些威脅是不可信的。12. 當(dāng)現(xiàn)有壟斷者有足夠多的生產(chǎn)潛能時(shí),對(duì)進(jìn)入者的威脅往往變得更加可信了。13. 有些博弈在純粹策略上沒(méi)有納什均衡,但在混合策略上一定有納什均衡。,本章小節(jié),,11 博弈

眾賞文庫(kù)> 全部分類(lèi)> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

秋石微觀經(jīng)濟(jì)學(xué)ch11

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

秋石微觀經(jīng)濟(jì)學(xué)ch11

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載