版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第十一章 博弈論與企業(yè)策略,一、博弈論概述(一)博弈論的研究對象 博弈論Game Theory研究決策主體的行為發(fā)生直接相互作用時的決策,以及這種決策的均衡問題,即,當一個主體的選擇受到其他主體選擇的影響,而且反過來影響到其他主體選擇時的決策問題和均衡問題。(二)博弈論的發(fā)展歷史 1944年,馮·諾依曼Von Neumann和摩根斯坦Morgenstern合作的《博弈論和經(jīng)濟行為》The
2、 Theory of Games and Economic Behaviour 一書出版,提出了預期效用理論等概念,但與現(xiàn)代博弈論關系不大。,1950’s,合作博弈發(fā)展到鼎盛時期,包括納什Nash和夏普里Sharpley1953 年的“討價還價模型”,Gillies和Sharpley1953年關于合作博弈中的“核”core的概念等。同時,非合作博弈也開始創(chuàng)立,納什在1950年和1951年發(fā)表了兩篇關于非合作博弈的重要文章,杜克于1950
3、年定義了“囚犯困境”prisoner’s dilemma,從而基本上奠定了現(xiàn)代非合作博弈的基礎。 1960’s年代后,澤爾滕R.Selten把納什均衡的概念引入了動態(tài)分析,提出了“精煉納什均衡”的概念。海薩尼J.Harsanyi把不完全信息引入博弈論的研究??巳鹌账筀reps和威爾遜Wilson 1982年合作發(fā)表了關于不完全信息動態(tài)博弈的重要論文。,專欄11-1:博弈論在微觀經(jīng)濟學中的重要性 1.博弈論
4、與新古典經(jīng)濟學 新古典經(jīng)濟學研究的是當外部條件既定時,單個廠商(消費者)的最大化決策問題,即在給定一個價格參數(shù)和成本(收入)的條件下,最大化其利潤(效用),廠商利潤(個人效用)函數(shù)只依賴于他自己的選擇,而不依賴于其他人的選擇;個人的最優(yōu)選擇只是價格和成本(收入)的函數(shù),而不是其他人選擇的函數(shù)。對單個人來說,其他人對其的影響都被總結在一個參數(shù)——價格里,決策時,他既不考慮自己的選擇對別人選擇的影響,也不考慮別人選擇對自己
5、的影響。 但是,新古典經(jīng)濟學的分析有兩個假定條件:一是市場參與者數(shù)量足夠多,從而市場是競爭性的;二是雙方不存在信息不對稱的問題。第一個條件在現(xiàn)實中并不具備,在市場參與者人數(shù)有限的情況下,即在不完全競爭市場上,人們之間的行為是直接影響的,所以,一個人在決策時,必 須考慮對方的反應,這就是博弈論研究的內容。同時,當信 息不對稱時,非價格制度會出現(xiàn),其顯著特征是,參與人之 間行為的相互作用,因此,博弈論又
6、成為分析非價格機制的 重要工具。 2.博弈論與諾貝爾經(jīng)濟學獎 (1)博弈論與諾貝爾獎的授予 1994年諾貝爾經(jīng)濟學獎授予了三位博弈論專家:納什、澤爾 滕和海薩尼。而1983年,英國wheatsheaf出版社出版的,由 當代在世的最著名的經(jīng)濟學術史專家Mark Blaug根據(jù)社會科 學文獻引證索引編寫的一本《經(jīng)濟學家名人錄》中,收錄了 從1970年到1981年間在世的674位,去世的397位,共
7、計 1071位經(jīng)濟學家的傳記。在這本名人錄中,沒有納什和澤爾 滕,只有海薩尼,但其名字下注著NE,即沒有條款,原因是 他自己沒有編寫簡歷。而僅僅十幾年后, 三人就獲得了諾貝,爾經(jīng)濟學獎,說明了博弈論和經(jīng)濟學發(fā)展的迅速。 2005年度諾貝爾經(jīng)濟學獎則授予持有以色列和美國雙重 國籍的羅伯特·奧曼和美國公民托馬斯·謝林。瑞典皇家科學 院說,兩位經(jīng)濟學家獲獎是因為“他們通過
8、對博弈論的分析 加深了我們對沖突與合作的理解”。這是自1994年之后,博 弈論學者再獲諾貝爾經(jīng)濟學獎。謝林,執(zhí)教于美國馬里蘭大 學經(jīng)濟學系,同時也是哈佛大學名譽教授。按照評委會的認 定,謝林的貢獻,在于顯示“某一方可以顯而易見地限制自 己的選擇,以此強化自身的(競爭)地位;報復的能力可以 比之抵御攻擊的能力更為有用;以及不確定的報復比之確定 的 報復更為可靠和更為有效?!痹u委會說,這些見解“已經(jīng)
9、證 明與化解沖突和努力避免戰(zhàn)爭有著相當大的關聯(lián)”。奧曼執(zhí),教于耶路撒冷希伯來大學理性分析中心。奧曼和謝林之所以 一同獲獎,是因為他們“以博弈論分析方式增進了我們對于 沖突與合作的理解。”具體到經(jīng)濟領域,他們幫助“解釋了諸 如價格戰(zhàn)和貿易戰(zhàn)之類的經(jīng)濟沖突,以及為什么一些社區(qū)相 對于其他社區(qū)在管理共有資源方面更為成功?!?(2)國外流行教科書中的博弈論 Hal Varian的《微觀經(jīng)
10、濟分析》Microeconomic Analysis是一本在歐美非常流行的高級微觀經(jīng)濟學教科書, 幾乎所有大學的研究生課程都用這本書。在1984年的第二 版中,沒有博弈論,甚至書后詞匯表中也沒有“博弈論”一詞。 但在1992年第三版就加上了“博弈論”一章,而且有關寡頭 競爭這一章也按博弈論理論重寫了。,克瑞普斯David Kreps1990年出版的《微觀經(jīng)濟理論教程》 A Course in M
11、icroeconomic Theory 是1991年最暢銷的經(jīng)濟學教科書,被相當多歐美名牌大學選為研究生教材,其中第三部分就是“非合作博弈”,共219頁,占全書的比重超過28%,其本人就是博弈論專家。1990年他因對博弈論的貢獻獲得美國“克拉克獎”Clark Medel。 泰勒爾Jean Tirole1988年出版的《產(chǎn)業(yè)組織理論》一書,是目前最受歡迎的、最流行的產(chǎn)業(yè)組織理論教科書,全書的內容都建立在非合作博弈的基礎
12、上,以至于作者不得不在最后加上一章“非合作博弈論”,供不熟悉的讀者參考。,相關鏈接11‐1 從日常生活看“博弈論” “博弈論” 原本是數(shù)學的一個分支, 但由于它較好地解 決了對于競爭等問題的可操作性分析, 成為經(jīng)濟學中激蕩 人心的一個研究領域??梢哉f, “博弈論”已經(jīng)改變了經(jīng)濟 學的傳統(tǒng)輪廓線。“博弈論” 的英語原文是game theory , 直譯過來就是游戲論、運動論或競賽論
13、。譬如, 在足球比 賽中, 雙方都想在努力鞏固防守的同時, 積極進攻以置對 方于“死地” , 這種行為就是一種博弈?!稗摹?在漢語中是下 棋的意思, 下棋中的雙方行為特征也如同足球比賽中雙方 的行為。當然,擴展開來講, 企業(yè)之間的競爭、國家之間 的角力等, 都是“游戲” , 只是游戲的內容不同而已。 我國古代有個“田忌賽馬” 的故事, 說的是齊威王與大將田忌各出三匹馬一對一比
14、賽三場, 由于齊威王的最優(yōu)、次優(yōu)和較差的三匹馬分別跑得比田忌的三匹馬快,所以田忌總是以0:3告負。后來田忌的謀士孫臏給田忌出主意,讓,最差的馬去與齊威王最快的馬比, 而讓最優(yōu)的馬去贏齊威王次優(yōu)的馬, 讓次優(yōu)的馬去贏齊威王最差的馬, 這樣便以2:1 取勝。但我們還可進一步設想, 如果齊威王知道了田忌的花招后, 便會在以后的比賽中也更改出馬的次序, 當然田忌的出馬次序也應改動。雙方的出馬次序怎樣才是最合理的呢? 這便是“博弈論” 更深層次研
15、究的問題了。 2002 年度獲奧斯卡大獎的影片枟美麗心靈枠中主角的原型, 便是“博弈論”中納什均衡的創(chuàng)立者—約翰· 納什。影片中有這樣一個情節(jié): 在美國普林斯頓大學的酒吧里,4 個男生正商量著如何去追求一位漂亮女生, 當時還正在大學讀書的納什卻在朦朧的“博弈論” 思維邏輯引導下喃喃自語: “如果他們4 個人全部去追求那漂亮女生,那她一定會擺足架子,誰也不睬。然后再去追其他女孩子,別人也不會接受,因為沒人愿
16、意當‘次品’ 。但如果他們先追其他女生,那么漂亮女生就會感到被孤立, 這時再追她就會容易得多。” 在納什眼里, 追求女生就是一場“博弈” , 而“博弈” 是要遵循一定的規(guī)則的,是需要“博弈” 策略的。,我們再從經(jīng)濟決策上來看“博弈論” 。假如你是一個公司的老總,你在決定是否將自己的產(chǎn)品降價以及降價多少時,必須首先要考慮至少以下幾個方面的問題:消費者將會增加購買嗎? 大概會增加多少購買量呢? 其他同種產(chǎn)品的廠家也會降價嗎? 等等。你只要是
17、理性的話,一定會在對這些問題進行考慮的基礎上來作出你的決策。所以說,“博弈論” 主要是研究各相關行為主體的決策行為相互影響、相互作用的假定條件下,理性的行為主體如何決策,以及這種決策的均衡等問題的。在這里,決策均衡是一個經(jīng)濟學概念,意味著最佳決策或最佳決策的組合。因為只要決策是最佳的,相關的行為主體就不會去改變它, 從而使它處于穩(wěn)定、均衡的狀態(tài)。再簡而言之,“博弈論” 就是分析博弈行為和博弈決策的一門科學。
18、 資料來源:葉德磊:從日常生活看“博弈論” ,文匯報, 2005 年10月23 日。,(三)博弈的要素 構成博弈的要素主要包括參與人、行動、戰(zhàn)略、支付、信息、均衡、結果等。 1.參與人players 一個博弈中的決策主體,其目的是通過選擇戰(zhàn)略(或 行動),以最大化自己的支付(效用)水平。 2.行動actions or moves
19、 行動是參與人在博弈的某個時點的決策變量。 1.行動集合action set:可供某個參與人(i)選擇的所有 行動的集合,寫作Ai={ai}。 2.行動組合action profile:n個參與人的行動的有序集 a=(a1,…,ai,…,an)。 3.行動順序the order of play:根據(jù)行動順序,可以將博 弈分為靜態(tài)博弈和動態(tài)
20、博弈。因此,行動順序對于博弈 結果非常重要。,3.戰(zhàn)略strategies 參與人在給定信息集的情況下的行動規(guī)則,它規(guī)定參與人在什么時候選擇什么行動。 戰(zhàn)略與行動是不同的概念,戰(zhàn)略是行動的規(guī)則而不是行動本身,戰(zhàn)略要說明什么時候采取什么行動。例如“人不犯我,我不犯人;人若犯我,我必犯人”,就是一個戰(zhàn)略,而“犯”與“不犯”是兩種行動,這一戰(zhàn)略規(guī)定了什么時候選擇“犯”與“不犯”的行動
21、??梢杂械膽?zhàn)略還包括:“人不犯我,我必犯人;人若犯我,我不犯人”;“人不犯我,我不犯人;人若犯我,我還不犯人”;“人不犯我,我必犯人;人不犯我,我還犯人”等。在靜態(tài)博弈時,戰(zhàn)略與行動是相同的,因為作為參與人行動的規(guī)則,戰(zhàn)略必須依賴于參與人獲得其他參與人行動的信息,而在靜態(tài)博弈中,雙方同時行動,從而不可能獲得對方行動的信息,因此戰(zhàn)略選擇就變成簡單的行動選擇。戰(zhàn)略必須是完備的。它要給出參與人在每一種可想象到的情況下的行動選擇,即使參與人
22、并不預期到這種情況會實際發(fā)生。,(1)戰(zhàn)略集合strategy set:某參與人i所有可選擇的戰(zhàn)略的 集合。Si={si}。 (2)戰(zhàn)略組合strategy profile:n個參與人每人選擇一個戰(zhàn) 略的n為向量。s=(s1,…,si,…,sn)。 4.支付pay off 在一個特定的戰(zhàn)略組合下,參與人得到的確定的效用水 平,或者是指參與人得到的期望效用水平。
23、 支付是博弈參與人真正感興趣的東西。 博弈的一個基本特征是,一個參與人的支付不僅取決于 自己的戰(zhàn)略選擇,而且取決于所有其他參與人的戰(zhàn)略選擇。 5.信息information 參與人有關其他參與人的特征、戰(zhàn)略、行動、支付等的知識 共同知識common knowledge:“所有參與人知道, 所有參與人知道所有參與人知道,所有參與人知道所
24、有參與 人知道所有參與人知道…”的知識。,6.均衡equilibrium 所有參與人的最優(yōu)戰(zhàn)略的組合,記為s*=(s1*,…,si*,…,sn*)。 7.結果outcome 即博弈均衡產(chǎn)生的博弈的最終后果,包括均衡及其支付。 (五)博弈的分類 1.根據(jù)博弈參與人劃分 (1)單人博弈。其實質是個體的最優(yōu)化問題,即在一定條 件下選擇
25、最優(yōu)戰(zhàn)略。單人博弈區(qū)別于兩人博弈和多人 博弈的根本之處在于,博弈的信息越多,支付越高。 (2)兩人博弈。參與人為兩人的博弈。 (3)多人博弈。三個或三個以上參與人的博弈。其與單人 博弈和兩人博弈最大的區(qū)別在于,可能存在“破壞 者”,即具有下列特征的參與人:其策略選擇對自身支 付沒有任何影響,但卻會影響其他參與人的支付,有
26、 時甚至是決定性的影響,如奧運會申辦。,2.根據(jù)戰(zhàn)略劃分 (1)有限博弈(finite game)。一個博弈被稱為有限博 弈,如果,第一參與人個數(shù)是有限的;第二,每個參與 人可選擇的純戰(zhàn)略是有限的。它可以用矩陣式、擴展 式,甚至羅列方式表示。 (2)無限博弈(infinite game)。不符合上述兩個條件的博 弈。一般用
27、數(shù)集或函數(shù)式表示。 3.根據(jù)支付劃分 (1)零和博弈。 無論各參與人如何決策,最后的社會總支付,即各參 與人支付之和總是為零。如猜謎游戲。一是各參與人之間的 利益是對立的,相互之間難以和平共處;二是各參與人為了 多得利益,總不希望對方知道自己選擇的戰(zhàn)略,因此,這種 博弈的結果是不能完全確定的;三是即使進行重復多次的博 弈,也不會產(chǎn)生新的機會或可能。,(2)常和
28、博弈。 各參與人支付之和總是等于一個非零常數(shù)。如分配固定 數(shù)額的獎金。各參與人之間的利益關系也是對立的,但較易 取得妥協(xié),因而往往有一個確定的結果。在重復博弈中,由 于總支付增加,會創(chuàng)造出許多新結果。 (3)變和博弈。 在不同的戰(zhàn)略組合下,各參與人支付之和是不同的。是 博弈的一般形式。 4.根據(jù)參與人行動次序劃分 (1)靜態(tài)博弈。
29、 參與人同時進行戰(zhàn)策選擇、同時行動;雖然各參與人做 出決策的時間不一定真正一致,但至少在其作出各自選擇前 都不知道其他參與人的戰(zhàn)略選擇;或在指導其他參與人戰(zhàn)略 選擇后不能改變自己已經(jīng)做出的選擇。,(2)動態(tài)博弈。 各參與人先后、依次進行選擇、行動,而且后選擇、行動的參與人在自己選擇前一般能看到此前其他參與人的選擇、行動的博弈。參與人之間存在不對稱性。后行為的參與人可根據(jù)先行動的參與人
30、的行動作出針對性選擇,而先行動的參與人在決策時,不但看不到后行動參與人的選擇,而且還要考慮后行動參與人的反應。 (3)重復博弈。 同一博弈反復進行所構成的博弈過程。構成重復博弈的一次性博弈稱為“原博弈”或“階段博弈”,其一般是靜態(tài)博弈。重復博弈的最少重復次數(shù)是兩次。其中,到一定重復次數(shù)后肯定要結束的重復博弈稱為“有限次重復博弈”。而無限次重復進行的博弈叫“無限次重復博弈”。在重復博弈中,考察的重點不是某一次
31、重復的結果或支付,而是原博弈重復進行后的總體效果或平均效果,因此,不能把重復博弈割裂為一次次獨立的博弈進行分析,而是要將它們作為一個完整的過程和整體進行分析,因此,重復博弈是一種特殊的動態(tài)博弈。在重復博弈中,一次靜態(tài)博弈中的均衡可能會發(fā)生變化。,5.根據(jù)參與人對其他參與人等的信息劃分 (1)完全信息博弈(complete information)。 若各參與人都完全了解所有參與人的特征、戰(zhàn)略、行動,以及在每種
32、戰(zhàn)略組合下的支付,并且不存在事前的不確定性,該博弈稱為“完全信息博弈”。 (2)不完全信息博弈(incomplete information) 至少存在部分參與人不完全了解其他參與人相關情況的博弈,稱為“不完全信息博弈”。 6.根據(jù)參與人對博弈進程信息,對動態(tài)博弈進行劃分 (1)動態(tài)博弈中,若某參與人行動時,對此前行動的各參與 人(包括“自然”)的選擇、行動完全了解,稱為“具有完美
33、 信息的”參與人。若其不完全了解此前全部的博弈進程,稱 為“具有不完美信息的”參與人。,(2)如果動態(tài)博弈中的所有參與人都是具有完美信息的,則 該動態(tài)博弈稱為“完美信息動態(tài)博弈”,perfect information。 若動態(tài)博弈中存在具有不完美信息的參與人,該博弈稱為“不 完美信息動態(tài)博弈”,(imperfect information)。 二、完全信息靜態(tài)博弈 (一)博弈的戰(zhàn)略式表述(strateg
34、ic form representation) 1.戰(zhàn)略式表述又稱為標準式表述normal form representation 在這種表述中,所有參與人同時選擇自己的戰(zhàn)略,所有參 與人選擇的戰(zhàn)略一起決定每個參與人的支付。需要注意得 是參與人“同時選擇”的是戰(zhàn)略,是參與人行動的全面計劃 和準則,而不是行動。因此,戰(zhàn)略式表述也可以用來描述 動態(tài)博弈。,2.戰(zhàn)略
35、式表述的組成及表示(1)博弈的參與人集合:i∈Ø; Ø=(1,2,…,n)(2)每個參與人的戰(zhàn)略空間:Si,i=1,2,…,n;(3)每個參與人的支付函數(shù):ui(s1,…,si,…,sn),i=1,2,…,n。 所以,G={S1,…,Sn;u1,…,un}代表戰(zhàn)略式表述博弈。 3.兩人有限博弈的戰(zhàn)略式表述的矩陣表述 例:囚犯困境prisoners’ dilemma,(二)占優(yōu)
36、戰(zhàn)略均衡 1.占優(yōu)戰(zhàn)略(dominant strategy)是指無論其他參與人選擇什么戰(zhàn)略,該參與人的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略被稱為 “占優(yōu)戰(zhàn)略”。例如,在 “囚犯困境”中,“坦白”是囚犯A的占優(yōu)戰(zhàn)略,“坦白”也是囚犯B的占優(yōu)戰(zhàn)略。 2.占優(yōu)戰(zhàn)略均衡(dominant-strategy equilibrium)是指在一個博弈里,如果所有參與人都有占優(yōu)戰(zhàn)略存在,則所有參與人占優(yōu)戰(zhàn)略所組成的戰(zhàn)略組合稱為“占優(yōu)戰(zhàn)略均衡”
37、。例如,在上例“囚犯困境”中,(坦白,坦白)就是占優(yōu)戰(zhàn)略均衡。這時,個人理性與集體理性產(chǎn)生了沖突。需要注意得是占優(yōu)戰(zhàn)略均衡只要求每個參與人是理性的,不要求“每個參與人是理性的”是共同知識。,(三)重復剔除的占優(yōu)均衡 1.例子:“智豬博弈” 在絕大多數(shù)博弈中,占優(yōu)戰(zhàn)略均衡是不存在的。在“智豬博弈”中,按下按鈕可有8個單位食物,但要支付2單位成本。若大豬先到,大豬吃7個單位,小豬吃1個單位;小豬先到,各吃4個單位
38、;同時到,大豬吃5個單位,小豬吃3個單位。 本例中,盡管 “等待”是小豬的占優(yōu)戰(zhàn)略,但大豬沒有占優(yōu)戰(zhàn)略,因此,本博弈沒有占優(yōu)戰(zhàn)略均衡。,2.重復剔除嚴格劣戰(zhàn)略和重復剔除的占優(yōu)均衡(iterated dominance equilibrium) (1)劣戰(zhàn)略 第一,嚴格劣戰(zhàn)略 1)定義 令si′和si″是參與人i可選擇的兩個戰(zhàn)略(即 si′∈Si,
39、 si″∈Si)。如果對于任意的其他參與人的 戰(zhàn)略組合s-i,參與人i從選擇si′得到的支付嚴格小于從 選擇si″得到的支付,即ui(si′,s-i)< ui(si″,s-i) s-I 我們說,戰(zhàn)略si′嚴格劣于戰(zhàn)略si″(si′is strictly dominated by si″)。 2)例子:在“智豬博弈”中,對于小豬,“按”嚴格劣于 “等待
40、”。,第二,弱劣戰(zhàn)略 1)定義 戰(zhàn)略si′弱劣于戰(zhàn)略si″(si′is weakly dominated by si″),如果對于所有的s-i,ui(si′,s-i)≤ ui(si″, s-i)∨s-i,且對于某些s-i,嚴格不等式成立。 si″稱為相對于si′的弱占優(yōu)戰(zhàn)略。 2)例子:在“智豬博弈”中,若“-1”變?yōu)椤?”,則對于小
41、 豬,“按”弱劣于“等待”。 (2)重復剔除(嚴格)劣戰(zhàn)略 第一,思路 首先找出某參與人的(嚴格)劣戰(zhàn)略(假定存在), 把這個(嚴格)劣戰(zhàn)略剔除掉,重新構造一個不包含已剔除 戰(zhàn)略的新博弈;然后再剔除這個新博弈中的某個參與人的 (嚴格)劣戰(zhàn)略;繼續(xù)這個過程,一直到只剩下一個唯一的 戰(zhàn)略組合為止。,第二,例子 在“智豬博弈”中,先剔除小豬的“按”戰(zhàn)
42、略,再剔除大豬的“等待”戰(zhàn)略,剩下唯一的戰(zhàn)略組合是(按,等待)。這里,小豬是“搭便車者”free rider。 (3)重復剔除的占優(yōu)均衡 如果一個戰(zhàn)略組合是重復剔除劣戰(zhàn)略后剩下的唯一的戰(zhàn)略組合,它被稱為“重復剔除的占優(yōu)均衡”。如果這種唯一的戰(zhàn)略組合是存在的,稱該博弈為“重復剔除占優(yōu)可解的”dominance solvable。如果重復剔除后剩下的戰(zhàn)略組合不唯一,該博弈不是重復剔除占優(yōu)可解的。 3.例子
43、 剔除的順序是:右 下 左,(上,中)是博弈結果。,,,如果每次剔除的是嚴格劣戰(zhàn)略,均衡結果與剔除順序無關;但如果剔除的是弱劣戰(zhàn)略,均衡結果可能與剔除順序有關。因此,一般使用嚴格劣戰(zhàn)略剔除。 (5)重復剔除嚴格劣戰(zhàn)略方法的缺陷 重復剔除嚴格劣戰(zhàn)略要求假定“參與人是理性的”是共同知識。這一條件比占優(yōu)戰(zhàn)略均衡嚴格。這一方法對博弈結果的預測經(jīng)常是不精確的,甚至許多博弈無法通過該方法找到均衡。例
44、如:,(4)納什均衡(Nash Equilibrium) 許多不存在占優(yōu)戰(zhàn)略均衡,或重復剔除的占優(yōu)均衡的博弈,卻存在納什均衡。 1.納什均衡的含義 納什均衡是一個戰(zhàn)略組合,當其余參與人不改變各自的戰(zhàn)略選擇時,某參與人也沒有動力單獨改變自己的選擇,這一點對所有參與人都成立。這就意味著,在納什均衡的戰(zhàn)略組合中,每一個參與人的戰(zhàn)略選擇都是針對其他參與人戰(zhàn)略組合的最優(yōu)選擇。
45、 納什均衡的特征——假定所有參與人簽訂一個協(xié)議,協(xié)議規(guī)定個參與人均選擇納什均衡中各自的戰(zhàn)略。則這一協(xié)議必定是可以自動實施的self-enforcing,否則,就不是納什均衡。,專欄11‐2 價格戰(zhàn)博弈 現(xiàn)在,我們經(jīng)常會遇到各種各樣的家電價格大戰(zhàn): 彩電大戰(zhàn)、冰箱大戰(zhàn)、空調大戰(zhàn)、微波爐大戰(zhàn)? ? 這些大戰(zhàn)的受益者首先是消費者。每當看到一種家電產(chǎn)品的價格大戰(zhàn), 百姓都會“沒事兒偷著樂” 。在這里,我們可以解釋廠家價
46、格大戰(zhàn)的結局也是一個“納什均衡” , 而且價格戰(zhàn)的結果是誰都沒錢賺,因為博弈雙方的利潤正好是零。競爭的結果是穩(wěn)定的, 即是一個“納什均衡” 。這個結果可能對消費者是有利的, 但對廠商而言是災難性的。所以, 價格戰(zhàn)對廠商而言意味著自殺。從這個案例中我們可以引申出兩個問題: 一是競爭削價的結果或“納什均衡” 可能導致一個有效率的零利潤結局; 二是如果不采取價格戰(zhàn),作為一種敵對博弈論,其結果會如何呢? 每一個企業(yè),都會考慮采取正常價格策略,還
47、是采取高價格策略形成壟斷價格, 并盡力獲取壟斷利潤。如果壟斷可以形成, 則博弈雙方的共同利潤最大。這種情況就是壟斷經(jīng)營所做的,通常會抬高價格。另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。,從這一點, 我們又引出一條基本準則: “把你自己的戰(zhàn)略建立在假定對手會按其最佳利益行動的基礎上?!?事實上,完全競爭的均衡就是“納什均衡” 或“非合作博弈均衡” 。在這種狀態(tài)下,每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。在這
48、種均衡中, 每一企業(yè)要使利潤最大化, 消費者要使效用最大化, 結果導致了零利潤,也就是說,價格等于邊際成本。在完全競爭的情況下, 非合作行為導致了社會所期望的經(jīng)濟效率狀態(tài)。如果廠商采取合作行動并決定轉向壟斷價格, 那么社會的經(jīng)濟效率就會遭到破壞。這就是為什么WTO 和各國政府要加強反壟斷的意義所在。,2.劃線法和納什均衡的求解(1)劃線法。一是對參與人i的每一個可選擇戰(zhàn)略,在參與人j使用最優(yōu)反應戰(zhàn)略時的支付下劃橫線。二是支付均有橫線的
49、戰(zhàn)略組合就是納什均衡 2.例子:在上例中 (下,右)是納什均衡。,3.納什均衡與占優(yōu)戰(zhàn)略均衡和重復剔除的占優(yōu)均衡 納什均衡是比重復剔除的占優(yōu)均衡,比占優(yōu)戰(zhàn)略均衡(適應性)條件更強的解的概念。 (1)每一個占優(yōu)戰(zhàn)略均衡都是納什均衡,而每一個納什均衡卻未必是占優(yōu)戰(zhàn)略均衡; (2)用重復剔除嚴格劣戰(zhàn)略方法,保留下的唯一的重復剔除的占優(yōu)均衡,就是納什均衡。 (3)納什均衡,不會被重復
50、剔除嚴格劣戰(zhàn)略方法剔除掉(但弱劣戰(zhàn)略剔除,可能會剔除納什均衡); (4)經(jīng)重復剔除嚴格劣戰(zhàn)略之后,有不唯一的多個戰(zhàn)略組合保留,其中有的戰(zhàn)略組合不一定是納什均衡。即重復剔除嚴格劣戰(zhàn)略方法,無法確保將所有非納什均衡戰(zhàn)略剔除,沒有被剔除的戰(zhàn)略組合不一定是納什均衡。 (5)沒有占優(yōu)戰(zhàn)略均衡均衡的博弈,不能用重復剔除嚴格劣戰(zhàn)略方法求解的博弈,可以有納什均衡。,4.沒有納什均衡和多個納什均衡 (1)沒有納什均衡——猜謎游戲matchi
51、ng pennies 這是一個零和博弈。 (2)多個納什均衡——性別戰(zhàn),(五)混合戰(zhàn)略納什均衡 1.混合戰(zhàn)略 (1)猜謎游戲的一個突出的特點是,每一個參與人都試圖先知道對方的戰(zhàn)略。一旦每方參與人都盡力知道其他參與人的戰(zhàn)略選擇,就不存在前面定義的納什均衡,因為參與人此時的最優(yōu)行為是不確定的,而博弈的結果必然要包含這種不確定性。 (2)純戰(zhàn)略(pure strategies)。在給定信息的情況下,
52、一個參與人的選擇是其戰(zhàn)略空間Si中的一個戰(zhàn)略si。例如在猜謎游戲中,出正面就是出幣人的一個純戰(zhàn)略,出反面也是他的一個純戰(zhàn)略。 (3)混合戰(zhàn)略(mixed strategies)。在給定信息的情況下,一個參與人的選擇是,以某種概率分布隨機選擇其戰(zhàn)略空間中的一些或全部戰(zhàn)略。例如,在猜謎游戲中,出幣人以0.5和0.5 的概率隨機選擇出正面和出反面就是一個混合戰(zhàn)略;以0.8和0.2的概率隨機選擇出正面和出反面是其另一個混合戰(zhàn)略。純戰(zhàn)略是混
53、合戰(zhàn)略的一個特例。,(4)注意 第一,一個給定的純戰(zhàn)略,可能會嚴格劣于一個混合戰(zhàn)略,即是這個純戰(zhàn)略并不嚴格劣于其他任何一個純戰(zhàn)略; 第二,一個給定的純戰(zhàn)略,可以是針對對方參與人一個混合戰(zhàn)略的最優(yōu)反應,即使這一純戰(zhàn)略并不是針對對方參與人任何一個純戰(zhàn)略的最優(yōu)反應。 2.混合戰(zhàn)略納什均衡 (1)混合戰(zhàn)略納什均衡的含義 混合戰(zhàn)略(P1*,P2*)是納什均衡的充要條件
54、是:每一個參與人的混合戰(zhàn)略是另一個參與人混合戰(zhàn)略的最優(yōu)反應,即V1(P1*,P2*)≥V1(P1,P2*),和V2(P1*,P2*)≥V2(P1*,P2)同時成立。(即對于參與人2的混合戰(zhàn)略P2*,參與人1選擇P1*的期望收益大于(不小于)自己選擇其他戰(zhàn)略的期望收益。這一點對于參與人2也成立。),(2)混合戰(zhàn)略納什均衡的求解 第一,支付最大化方法--- 以猜謎游戲為例 假定“出幣人”的混合戰(zhàn)略為δh=(θ,
55、1-θ),即“出 幣人”以θ的概率選擇出正面,以1-θ的概率選擇出反面。 “猜幣人”的混合戰(zhàn)略為δa=(γ,1-γ),即“猜幣人”以 γ的概率選擇猜正面,以1-γ的概率選擇猜反面。 “出幣人”的期望效用為: Vh(δh,δa)=θ[-1·γ+1·(1-γ)]+(1-θ) [1·γ+(-1)·(1-γ)]=θ(
56、2-4γ)+(2γ-1) 對上述效用函數(shù)求微分,得到“出幣人”效用最大化的一階條件為: =2-4γ=0;γ*=0.5 在混合戰(zhàn)略納什均衡中,“猜幣人”以0.5的概率猜正 面,以0.5 的概率猜反面。,同樣,“猜幣人”的期望效用為: Va(δh,δa)=γ[1·
57、;θ+(-1)·(1-θ)]+(1-γ) [(-1)·θ+1·(1-θ)] =γ(4θ-2)+(1-2θ) 對上述效用函數(shù)求微分,得到“猜幣人”效用最大化的一階條件為:
58、 =4θ-2=0;θ*=0.5 即在混合戰(zhàn)略納什均衡中,“出幣人”以0.5的概率出正面,以0.5 的概率出反面。在猜謎游戲中,θ*=0.5,γ*=0.5是唯一的納什均衡。,第二,支付等值法 “出幣人”出正面的期望收益為:(-1)·γ+1·(1-γ)=1-2γ “出幣人”出反面的期望收益為:1·γ+(-1)&
59、#183;(1-γ)=2γ-1當且僅當 將以上θ隨γ的變化用函數(shù)關系表達出來,就得到下圖 所示的反應對應θ=θ*(γ)。在這里,因為存在一個γ 值,使得θ*(γ)有不止一個解,稱θ*(γ)為“出幣人” 的最優(yōu)反應對應best-response correspondence,如果對于 每一個γ值,θ*(γ)只有一個解,稱θ*(γ)為“出幣人” 的最優(yōu)反應函數(shù)best
60、-response function。,“猜幣人”猜正面的期望收益為: 1·θ+(-1)·(1-θ)=2θ-1 “猜幣人”猜反面的期望收益為:(-1)·θ+1·(1-θ)=1-2θ 當且僅當 將以上γ隨θ的變化用函數(shù)關系表達出來,就得到下圖所示的反應對應γ=γ*(θ)。,最優(yōu)反應對應θ*(γ)和γ*(θ)的交點就是混合戰(zhàn)略納什均衡。如果“出幣人”的戰(zhàn)
61、略是(0.5,0.5),“猜幣人”的最優(yōu)反應就是(0.5,0.5);反之,亦成立。 第三,注意 (1)一個混合戰(zhàn)略要成為對方參與人戰(zhàn)略s2的最優(yōu)反應,混合戰(zhàn)略中每一個概率大于零的純戰(zhàn)略本身也必須是對s2的最優(yōu)反應。 (2)如果參與人1有n個純戰(zhàn)略都是對方參與人戰(zhàn)略s2的最優(yōu)反應,則這些純戰(zhàn)略全部或部分的任意線性組合(同時,其他純戰(zhàn)略的概率為零)形成的混合戰(zhàn)略同樣是參與人1對s2的最優(yōu)反應。,(六)納什均衡的存在性
62、 1.四種均衡的關系 占優(yōu)戰(zhàn)略均衡DSE、重復剔除的占優(yōu)均衡IEDE、純戰(zhàn)略納什均衡PNE和混合戰(zhàn)略納什均衡MNE,每個均衡概念依次是前一個均衡概念的擴展,或者說,前一個均衡是后一個均衡概念的特例。 如果將在某個適當定義的均衡的所有博弈定義為一個集合,那么,存在前一個均衡的集合依次為存在后一個均衡的集合的子集。如圖: 一般,將上述四個均衡概念統(tǒng)稱為納什均衡NE。,2.納
63、什均衡的存在性 是不是所有的博弈都存在納什均衡?不一定。納什于1950年證明,每一個有限博弈,至少存在一個納什均衡(純戰(zhàn)略納什均衡或混合戰(zhàn)略納什均衡)。(這里,有限博弈指,博弈有有限個參與人,且每個參與人有有限個純戰(zhàn)略)。 三、不完全信息靜態(tài)博弈和動態(tài)博弈的主要思路 (一)完全信息動態(tài)博弈 完全信息靜態(tài)博弈的納什均衡存在三個問題:第一,一 個博弈可能有不止一個納什均衡,哪個納什均
64、衡會發(fā)生是不 知道的,例如“性別戰(zhàn)”博弈;第二,在納什均衡中,參與人 在選擇自己的戰(zhàn)略時,把其他參與人的戰(zhàn)略當作給定的,不 考慮自己的選擇如何影響對手的戰(zhàn)略。這一假設只適合靜態(tài) 博弈,在動態(tài)博弈下就不適合了;第三,由于不考慮自己選 擇對別人選擇的影響,納什均衡允許不可置信威脅的存在。,例如:“市場進入阻撓”(entry deterrance)博弈 已經(jīng)在市場上的壟斷企業(yè)稱為“
65、在位者”,試圖進入的新企業(yè)稱為“進入者”,博弈矩陣如下 這個博弈的納什均衡有兩個:(進入,默許), (不進入,斗爭)。對于進入者,在位者發(fā)出“你進入我就斗爭”的威脅是不可置信威脅,因為,進入者如果進入,在位者的最優(yōu)行動是默許。但是納什均衡承認了這種不可置信威脅,于是(不進入,斗爭)成為了一個納什均衡。 于是,澤爾騰定義了“子博弈精煉納什均衡”,中心意義是將納什均衡中包含的不可置
66、信威脅戰(zhàn)略剔除出去。,(二)不完全信息靜態(tài)博弈 在不完全信息下,某個博弈參與人對對方的特征(生產(chǎn)函數(shù))、戰(zhàn)略空間、各種戰(zhàn)略組合下的支付等并不是全部了解。 海薩尼(1967-1968)的貢獻就是引入一個虛擬的參與人——“自然”,自然首先行動——選擇參與人的“類型”。被選擇的參與人知道自己的真實類型,其他參與人只知道被選擇的參與人的各種可能類型的概率分布。而且,這一概率分布是共同知識。
67、 海薩尼的上述工作稱為“海薩尼轉換”(the Harsanyi transformation)。這樣,“不完全信息博弈”(games of imcomplete information)就變成了“完全但不完美信息博弈”(complete but imperfect information)。這里,“不完美”是指,自然做出了他的選擇,但其他參與人并不知道他的選擇是什么,僅知道各種選擇的概率分布。,在這個基礎上,海薩尼定義了“貝葉斯納什
68、均衡”。貝葉斯均衡是納什均衡在不完全信息中的擴展。其含義是,在不完全信息靜態(tài)博弈中: (1)參與人同時行動,所以不能觀察到別人的選擇。給定別人的選擇,每個人的最優(yōu)戰(zhàn)略依賴于自己的類型。 (2)每個參與人只知道對方的類型的概率分布,而不知道對方真實類型,所以他不知道對方實際的戰(zhàn)略選擇。但是他知道其他參與人的戰(zhàn)略選擇是如何依賴于其各自類型的。 (3)于是,參與人的決策目標就是,在給定自己的類型和別人的類型依從戰(zhàn)略的情況下,最大化
69、自己的期望支付。 于是,貝納斯納什均衡是這樣一種類型依從戰(zhàn)略組合: 在給定自己的類型和別人類型的概率分布的情況下,每個參 與人的期望支付達到了最大化。,相關鏈接11‐2 上海大眾營銷策略博弈分析 上海大眾憑借其在中國內地市場近20 年的積累, 已 成為中國轎車市場的一線領軍廠商。但現(xiàn)在上海大眾面臨著 更多市場進入者的挑戰(zhàn), 其壟斷地位受到威脅, 市場占有
70、 率逐漸萎縮。而新進入的廠商除了不斷推出新車型占領細分 市場外, 其蠶食市場的最主要手段就是以相對較低的價格沖擊市場。 面對激烈競爭, 上海大眾也在竭力維護其車壇老大的 地位, 其技術含量高的新車型投放市場的步伐明顯加快。 但是從整體上看, 上海大眾的價格與新進入的廠商相比依 然堅挺。并且, 上海大眾的有關負責人公開在媒體上表示 “市場的領導者是不會主動降價的” , “上海大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 西北大學經(jīng)濟管理學院
- 西北大學經(jīng)濟管理學院旅游管理專業(yè)介紹
- 西北大學經(jīng)濟管理學院mba學位論文規(guī)范
- 西北大學經(jīng)濟管理學院企業(yè)管理專業(yè)介紹
- 西北大學經(jīng)濟管理學院新生入學全攻略
- 西北大學經(jīng)濟管理學院經(jīng)濟思想史專業(yè)介紹
- 西北大學經(jīng)濟管理學院工商管理(mba)專業(yè)介紹
- 西北大學經(jīng)濟管理學院會計學專業(yè)介紹
- 西北大學經(jīng)濟管理學院國民經(jīng)濟學專業(yè)介紹
- 經(jīng)濟管理學院
- 海南大學經(jīng)濟管理學院
- 西北大學經(jīng)濟管理學院政治經(jīng)濟學專業(yè)介紹
- 西北大學經(jīng)濟管理學院mba中心應聘人員登記表
- 2019年西北大學經(jīng)濟管理學院復試工作方案
- 西北農林科技大學經(jīng)濟管理學院情況
- 西北大學經(jīng)濟管理學院博士研究生學位論文規(guī)范要求
- 清華大學經(jīng)濟管理學院
- 西北農林經(jīng)濟管理學院考研經(jīng)驗專業(yè)指導
- 經(jīng)濟管理學院復試安排
- 經(jīng)濟管理學院學術講座
評論
0/150
提交評論