基于信息和理性的博弈均衡實現(xiàn)途徑及其效率分析.pdf_第1頁
已閱讀1頁,還剩117頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、均衡一直是經(jīng)濟學研究的重要問題,更是博弈理論中的核心概念.均衡思想的發(fā)展決定了博弈論的基本前進方向.不管是基于零和博弈的馮·諾依曼最大最小均衡還是針對一般博弈的納什均衡都是基于完全理性的假設提出的,它們背離了“理性有限性”這一客觀實際.隨著演化博弈論的不斷發(fā)展,人們普遍認為,均衡是在有限理性參與人的不斷重復博弈中實現(xiàn)并變化的.在一個動態(tài)博弈中,當相互影響的各要素處于一種狀態(tài)時,任何一種要素都沒有單獨離開該狀態(tài)的傾向,則該狀態(tài)為動態(tài)博弈的

2、一個均衡.均衡分析的核心就是對重復博弈動態(tài)系統(tǒng)的狀態(tài)向量進行分析,找出均衡實現(xiàn)的路徑.
   論文首先對影響博弈均衡的要素進行了系統(tǒng)研究與分析.博弈由博弈主體、博弈語境和信號三個基本要素組成,而信息、理性和效用則是博弈主體的根本屬性.這些要素共同決定博弈主體在博弈中的行為.博弈主體的根本任務就是要通過對博弈語境的學習,使主觀認識和客觀事實不斷接近,理性不斷改善,最終在均衡路徑上獲取較優(yōu)的博弈效用.論文對信息的描述方法進行了系統(tǒng)分

3、析,提出了以主題、事件和概率為主要構成的分布式描述方法,并建立了基于時間和空間的信息二維測度模型.同時,在對理性本質(zhì)進行綜合分析的基礎上,建立了理性形式化表示的具體思路和方法.
   論文提出了基于占優(yōu)理性的多種典型均衡概念.文章指出占優(yōu)均衡是在占優(yōu)理性支配下實現(xiàn)的.占優(yōu)理性不等于完全理性,占優(yōu)理性是有限理性的一種典型形式,而完全理性則是一種理想主義狀態(tài).文章提出了互制均衡和互利均衡這兩種典型均衡概念.互制均衡強調(diào)以個體理性為中

4、心的自我實現(xiàn),傾向個體利益最優(yōu),忽視博弈群體對自身行為的影響,博弈結果常常會與博弈者提高效用的宗旨背道而馳.這種以個人占優(yōu)為出發(fā)點而形成的博弈均衡往往不能取得帕累托優(yōu)化的結果.互利協(xié)調(diào)是互制均衡的進一步精煉,在強調(diào)自我實現(xiàn)的基礎上,注重雙贏,引導合作.互利協(xié)調(diào)和互制均衡都是演化的聚點,通過對既存在互利協(xié)調(diào)又存在互制均衡的多態(tài)非退化博弈的動態(tài)分析,系統(tǒng)探討和研究了協(xié)調(diào)和均衡的到達路徑.
   論文對基于帕累托均衡優(yōu)化的期望均衡進行

5、了研究.期望均衡是博弈局中人或局外人對于博弈均衡點的一種期望.顯然,期望均衡應該帕累托優(yōu)于納什均衡.期望均衡強調(diào)互利共贏,它要求博弈群體的每個成員對期望均衡點有一個共同的預期,要實現(xiàn)這種期望均衡,可采用局中人參與的訓練與學習使得群體的預期一致.博弈訓練者通過重復的博弈偏離行為向其它博弈者傳遞訓練信號,使學習者對博弈語境的認識發(fā)生改變,進而引導學習者采取更有利于訓練者的行動.在使用博弈訓練時,應遵循“利已、利他、可信、可辯”的原則,從全局

6、的角度審視整個博弈環(huán)境,選擇利己利他的訓練方法,最終取得較優(yōu)的訓練效果.當然,不同理性的人對于訓練者的偏離行為有著不同的理解,具有模仿學習理性的主體將模仿對手的偏離行為,具有反應學習理性的主體將針對對手的偏離行為采取最佳的反應.而具有跟進理性的學習者則認為對手的這種偏離行為代表了一種對博弈結果的預期,如果識別這種預期并跟進,將帶來比自由博弈更好的雙贏結局.此外,論文對采用第三方過濾器來實現(xiàn)期望均衡進行了研究.在基于過濾的期望均衡中,策略

7、組合概率的形成,是由個體策略選擇和第三方約束機制所共同決定的.第三方過濾器在設計時,必須保證約束條件的均衡性和總體最優(yōu)性,特別重要的是,群體利益是在不違背個體利益的基礎上取得的.在第三方均衡的概率分布下,任何參與者都沒有偏離的動機.否則,第三方過濾器就是不公平的,形成的約束條件也就是不穩(wěn)定的、無效的.
   最后,文章從語境、信息和理性三個方面對均衡實現(xiàn)的有效性進行了分析.在不同的語境下,博弈雙方將受到不同的制約,獲得不一樣的效

8、用.在同一語境下,如果信息使我們的信念逼近事實,則一定會帶來更多的效用.當然,信息的獲取有可能改變博弈的環(huán)境,從而影響信息在均衡實現(xiàn)中的效用.通過對不同理性下的均衡動態(tài)分析,文章得出了一些有益的結論.有限理性博弈者的參與,有可能使博弈雙方走出占優(yōu)博弈的困境.但是,基于簡易模仿和簡易訓練的重復博弈未必是有效的.由于主體行為是相互影響的,所以訓練策略必須是互動的,而不是一成不變的.IPD模型中不同理性持有人的行為在本質(zhì)上也是一種訓練,因為他

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論