版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第三講混合策略納什均衡,,,我們將納什均衡定義為一組滿足所有參與人的效用最大化要求的策略組合,即( s1*,…, si* , … , sn* )是一個納什均衡,當且僅當(ui(si*, s-i *) ≥ ui(si′, s-i *)。根據(jù)這一定義,有些博弈不存在納什均衡的。,,社會福利博弈 流浪漢
2、 找工作 游蕩 救濟 3,2 -1,3 政府 不救濟 -1,1 0,0,,,,,,這個博弈不存在納什均衡。給定政府救濟,流浪漢的最優(yōu)策略是游蕩;給定流浪漢游蕩,政府的最優(yōu)策略是不救濟;給定政府不救濟,流浪漢的最優(yōu)策略是找工作;給定流浪漢找工作,政府的最優(yōu)戰(zhàn)略是救濟;如此等等,
3、沒有一個策略組合構(gòu)成納什均衡。,,猜謎游戲(A決定,B來猜;B猜中,獎勵;否則,懲罰) B 正面 反面 正面 -1,1 1,-1 A 反面
4、 1,-1 -1,1,,,,,,上述兩個博弈的顯著特征是,每個參與人都想猜透對方的策略,而每一個參與人又都不能讓對方猜透自己的策略。這樣的情況出現(xiàn)在諸如體育比賽和戰(zhàn)爭等情況中都會出現(xiàn)。在這類博弈中,都不存在納什均衡。,,上述兩個博弈不存在純策略納什均衡,但是存在下面將要定義的混合策略納什均衡。這里的混合策略是指參與人以一定的概率選擇某種策略,比如說,參與人以0.3概率選擇第一種策略,以0.2的概率選擇第二種策略,以0
5、.5的概率選擇第三種策略。如果一個采取混合策略,他的對手就不能準確猜出他實際上會選擇的策略,但在均衡點可以知道對手不同策略的概率分布。,,流浪漢 找工作 游蕩 救濟 3,2 -1,3 政府 不救濟 -1,1 0,0設想
6、政府以1/2的概率選擇救濟,1/2的概率選擇不救濟。對流浪漢來說,選擇尋找工作的期望效用是1/2×2+ 1/2×1=1.5,選擇游蕩帶來的期望效用為1/2×3+ 1/2×0=1.5。所以流浪者的任何一種策略(純的或混合)都是對政府所選擇的混合策略的最優(yōu)反應。如果流浪漢以0.2的概率選擇找工作,以0.8的概率選擇游蕩,政府的任何一種策略(純的或混合)都是對流浪漢所選擇的混合策略的最優(yōu)反應。每一個參
7、與人的混合策略都是給定對方混合策略時的最佳選擇,這一混合策略組合就是一個納什均衡,,混合策略的定義:在博弈G={s1,s2, …,sn}中,博弈方i的策略空間為Si=(si1,si2, …,sik),則博弈方以pi=(pi1,pi2, …,pik)隨機選擇k個可選策略稱為一個混合策略。其中,0≤pik≤1,k=1,2, …,k,且pi1+pi2+…+pik=1相對于這種以一定概率分布在一些策略中隨機選擇,原來的確定性的具體的策略稱為純
8、策略,原來的納什均衡也稱為純策略納什均衡。純策略也可看作特殊的混合策略。我們把納什均衡的概念也作相應的擴大:對一個策略組合,無論它是純策略還是混合策略,只要滿足各博弈方都不想單獨偏離它,就稱其為納什均衡。,,混合策略納什均衡的求法,可以通過計算各方的期望得益,尋求使自己期望得益最大化的最佳反應函數(shù),求各博弈方的最佳反應函數(shù)的公共解??梢杂们笞罴逊磻瘮?shù)交點的方法,也可以用解方程組得方法。還可以應用下面的原則來計算:任何博弈方的在混合策
9、略納什均衡中的所選策略,都必須使其他博弈方選擇其任何策略的期望得益相同。即自己的選擇要使對方無機可乘,不能通過有針對性的傾向是某一策略成為優(yōu)勢策略。再舉一個例子。,,例 某博弈的得益矩陣為 乙 C D A 2,3 5,2
10、 甲 B 3,1 1,5這個博弈沒有純策略納什均衡。要計算混合策略納什均衡,設甲的混合策略為(p,1-p),則甲的選擇必須使乙選C和選D的期望得益相等,即:p×3+(1-p) ×1=p×2+(1-p) ×5解得p=0.8。即甲的混合策略是(0.8,0.2),,同樣,設乙的混合策略為(q,1-q) ,則乙的納什均衡策略也必須
11、使甲無論選A還是選B的期望收益相等。即: q×2+(1-q) ×5=q×3+(1-q) ×1解得 q=0.8 即乙的混合策略也是(0.8,0.2)容易算出在這個混合策略納什均衡下,甲乙各自的得益都是2.6.它的意義是說,雖然在一次博弈中,其結(jié)果只能是得益矩陣中四個得益的一種,但多次獨立重復進行,平均結(jié)果是雙方各得2.6.,,1.制式問題 彩電有不同的制式,采用相同的
12、制式,則不同廠商間的零部件可以通用,相關設備可以相互匹配,對大家有一定的好處,但也有互相競爭的壓力和損失。設兩個廠商要引進生產(chǎn)線,面臨A、B 兩個制式,其得益矩陣如下: 廠商2 A B A 1,3 0,0 廠商
13、1 B 0,0 2,2,,容易看出,該博弈有兩個純策略納什均衡:(A,A)和(B,B),但會出現(xiàn)哪一個均衡呢?可以看出,廠商1喜歡后一個而廠商2 喜歡前一個均衡。沒有必然的結(jié)果,因此,雙方的決策要進行混合策略決策。不難算出廠商1的納什均衡混合策略是(0.4,0.6) 廠商2的混合策略納什均衡策略是(0.67,0.33)在此均衡下,雙方的期望得益分別為0.664
14、 和1.926,都小于任何一個純策略納什均衡的得益。由此可見,政府或行業(yè)組織制定統(tǒng)一的標準或規(guī)定是非常重要的。這也是世界上各國甚至國際間對許多重要產(chǎn)品規(guī)定統(tǒng)一規(guī)格、標準的原因。當然因為技術壟斷等因素,也有相反的、各廠商間不統(tǒng)一的例證:如打印機墨盒、手機充電器等。,,2.市場機會 設兩個廠商都發(fā)現(xiàn)了一個市場機會,但市場容量不大。若只有一家進入,能賺100,若同時進入,則各虧50.
15、 廠商2 進 不進 進 -50,-50 100, 0廠商1 不進 0 ,100 0 , 0,0本博弈也有兩個純策略納什均衡(不進,進),(進,不進)但它們分別有利于兩個廠商,因此這兩個均衡都不容易實現(xiàn),
16、都應采取混合策略。請同學們自己計算混合策略納什均衡及得益。,,在包括混合策略的情況下,嚴格劣策略消去法有時仍然使用。因為嚴格劣策略消去法不會消去任何納什均衡。如下面的例子: 乙 A B C 3,1
17、 0,2 甲 D 0,2 3,3,,甲、乙的策略沒有好壞之分。但若甲以混合策略(0.5,0.5,0)選擇C、D、E,則博弈方乙選擇純策略A時,甲期望得益0.5×3+0.5×0+0×1=1.5乙選擇純策略B時,甲期望得益0.5×0+0.5×3+0×1=1.5乙選擇混合策略(q,1-q) 時,甲期望得益
18、0.5×q×3+0.5×(1-q) ×0+0.5×q×0+0.5×(1-q) ×3=1.5,,可見,無論乙采用什么策略,甲采用混合策略都大于采用E的得益1,因此,E是甲的嚴格劣策略。因此去掉E,博弈就簡化為: 乙 A
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論