1樓:匿名使用者
一次博弈最終總會形成乙個結果,好比討價還價,這就是博弈均衡。"納什均衡"是一種最常見的、也是最重要的博弈均衡。它是美國天才數學家納什在2023年正在攻讀博士學位時提出來的,**題為《n人博弈的均衡問題》。
納什巧妙運用數學技巧,證明了如下定理:對一任何乙個n人參與的非合作博弈(零和或非零和),如果每個參與者的策略是有限的,那麼一定存在至少乙個納什均衡解集。該**只有短短一頁紙,但卻成了博弈論的經典文獻,並使他獲得了諾貝爾經濟學獎。
"納什均衡"的經典案例是"囚徒困境":兩個作案嫌疑人分別關在兩件牢房,警察告知,如果兩人都招供,則各坐牢3年;如果兩人都不招供,則放出;如果一人招供而另一人不招供,則招供的坐牢3年,不招供的坐牢10年。局外人看來,最好兩人都不招供。
但從每個人來看,招與不招的代價分別為與,還是招供為好。
但從納什均衡卻得出乙個悖論:單個人的最優選擇卻沒有導致全域性最佳的結果。現實中的例子很多,如**戰的結果是兩敗俱傷。
"納什均衡"證明了乙個道理:非合作博弈的情況下困境無法解脫。
什麼是納什均衡?能不能舉個簡單的例子
2樓:匿名使用者
納什均衡是一種策略組合,使得同一時間內每個參與人的策略是對其他參與人策略的最優反應。
假設有n個局中人參與博弈,如果某情況下無一參與者可以獨自行動而增加收益(即為了自身利益的最大化,沒有任何單獨的一方願意改變其策略的[1] ),則此策略組合被稱為納什均衡。所有局中人策略構成乙個策略組合(strategy profile)。納什均衡,從實質上說,是一種非合作博弈狀態。
納什均衡達成時,並不意味著博弈雙方都處於不動的狀態,在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的。納什均衡也不意味著博弈雙方達到了乙個整體的最優狀態,需要注意的是,只有最優策略才可以達成納什均衡,嚴格劣勢策略不可能成為最佳對策,而弱優勢和弱劣勢策略是有可能達成納什均衡的。在乙個博弈中可能有乙個以上的納什均衡,而囚徒困境中有且只有乙個納什均衡。
案例囚徒困境
假設有兩個小偷a和b聯合犯事、私入民宅被警察抓住。**將兩人分別置於不同的兩個房間內進行審訊,對每乙個犯罪嫌 疑人,**給出的政策是:
如果乙個犯罪嫌疑人坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪。如果另乙個犯罪嫌疑人也作了坦白,則兩人各被判刑8 年。
如果另乙個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。
如果兩人都抵賴,則**因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。
關於案例,顯然最好的策略是雙方都抵賴,結果是大家都只被判1年。但是由於兩人處於隔離的情況,首先應該是從心理學的角度來看,當事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當·斯密的理論,假設每個人都是「理性的經濟人」,都會從利己的目的出發進行選擇。這兩個人都會有這樣乙個盤算過程:
假如他坦白,如果我抵賴,得坐10年監獄,如果我坦白最多才8年;假如他要是抵賴,如果我也抵賴,我就會被判一年,如果我坦白就可以被釋放,而他會坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了划算。兩個人都會動這 樣的腦筋,最終,兩個人都選擇了坦白,結果都被判8年刑期。
基於經濟學中rational agent的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判處一年就不會出現。這樣兩人都選擇坦白的策略以及因此被判8年的結局,納什均衡」首先對亞當·斯密的「看不見的手」的原理提出挑戰:按照斯密的理論,在市場經濟中,每乙個人都從利己的目的出發,而最終全社會達到利他的效果。
但是我們可以從「納什均衡」中引出「看不見的手」原理的乙個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。
納什均衡和佔優有什麼區別?可以舉乙個例子(納什均衡和佔優均衡不完全相同的例子)說明一下嗎?
3樓:高傲的沙漠之狐
首先說佔優均衡。佔優均衡是指,對乙個player1來說,無論其他players的策略是什麼,這個player1的最優決策都是同乙個。例如囚徒困境中,兩個囚徒的最優決策都是坦白,而無論對方的決策是什麼。
對方坦白,我也坦白;對方繼續撒謊不坦白,我的最優策略還是坦白。坦白就是我的最優策略。同樣地,如果對方也有乙個最優策略,那麼(坦白,坦白)就構成了佔優均衡。
納什均衡是指,對乙個player1來說,如果給定其他players的決策,player1會選擇策略one,即策略one是player1在當前條件下的乙個最優策略;同樣的,如果其他players的決策,也都是當前條件下的最有策略的話,那麼這些決策構成乙個納什均衡。在納什均衡下,沒有player會改變自己的決策。
佔優均衡一定是納什均衡。納什均衡不一定是佔優均衡。
4樓:凌楚天
佔優均衡(dominant equilibrium),指不論其他參與者做何種策略選擇,每個參與者的最佳策略都是唯一的,其結果為佔優均衡。 佔優均衡一定是納什均衡。在「囚徒困境」中,不論囚徒b坦白還是不坦白,囚徒a的最優選擇都是坦白;同樣對於囚徒b來說,不論囚徒a坦白還是不坦白,他的最優策略是擔白。
因此(坦白,坦白)是策略組合的佔優均衡,同時這一策略組合又一定是納什均衡。因為乙個參與者的佔優均衡是對基他參與者任何設定策略的最優選擇。
佔優均衡是納什均衡的其中一種情況,所以如果是佔優均衡就一定是納什均衡,而如果不是佔優均衡,跟納什均衡就沒有什麼關係了,所以沒有這樣的例子。
納什均均衡中,多個均衡點是什麼情況?能舉幾個例子嗎?
5樓:匿名使用者
多個均衡點的例子很多 無論是純戰略納什均衡和混合戰略納什均衡都與出現 舉個最最最入門的例子給你看 這個例子一般博弈論都有學過的
情侶博弈
即使是情侶雙方的愛好或者偏好還是不盡相同的。大海和麗娟正在熱戀,難得的週六又到了,安排什麼節目好呢?週六晚上,中國足球隊要在世界盃小組賽中和巴西隊比賽。
大海是個超級球迷。也正好是這個週六的晚上,俄羅斯乙個著名芭蕾舞劇團蒞臨該市。麗娟喜歡這樣高雅藝術。
那麼,乙個人自已在家裡看電視轉播的足球賽,乙個去劇院看芭蕾演出,不就得了?問題在於,他們是熱戀中的情侶,分開度過難得的週六,是他們最不樂意的事情。這樣一來,他們真是面臨了一場「博弈」。
我們不妨這樣給大海和麗娟的「滿意程度」賦值:如果大海看球讓麗娟乙個人去看芭蕾,雙方的滿意程度都為0;兩個人一起看足球,大海的滿意程度為2,麗娟的滿意程度為1;兩個人一起去 看芭蕾,大海的滿意程度是1,麗娟的滿意程度為2;
在情侶博弈中,雙方都去看足球,或者雙方都去看芭蕾,就是我們所說的相對優勢策略的組合,一旦處於這樣的位置,雙方都不想單獨改變策略,因為單獨改變沒有好處,比方說兩人一起看足球,大海得2,麗娟得1;如果大海改變主意單獨去看足球,變成雙方都是0,沒有好處;如果麗娟改變主意單獨去看芭蕾,也變成雙方都得0,也沒有好處。所以,兩個人一起去看足球是穩定的局面。同樣,兩個人一起去看芭蕾也是穩定的局面。
這種穩定的結局就是「納什均衡」。在情侶博弈中,雙方都去看足球,或者雙方都去看芭蕾,是博弈的兩個納什均衡。形象地說,納什均衡實際上就是一種「僵局」:
給定別人不改變策略的情況下,沒有人有興趣單獨改變策略,而且,這種單獨改變不會給他帶來好處。
6樓:匿名使用者
a b
c (3,1) (2,2)
d (2,2) (1,3)
這裡兩個(2,2)就是兩個納什均衡
讓你徹底明白,什麼是納什均衡
7樓:葵姐是我
納什均衡,nash equilibrium ,又稱為非合作博弈均衡,是博弈論的乙個重要術語,以約翰·納什命名,是一種策略組合,使得每個參與人的策略是對其他參與人策略的最優反應。
納什均衡達成時,並不意味著博弈雙方都處於不動的狀態,在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的。
納什均衡可以分成兩類:"純戰略納什均衡"和"混合戰略納什均衡"。
純戰略是提供給玩家要如何進行賽局的乙個完整的定義。特別地是,純戰略決定在任何一種情況下要做的移動。戰略集合是由玩家能夠施行的純戰略所組成的集合。
合戰略是對每個純戰略分配乙個機率而形成的戰略。混合戰略允許玩家隨機選擇乙個純戰略。混合戰略博弈均衡中要用概率計算,因為每一種策略都是隨機的,達到某一概率時,可以實現支付最優。
因為機率是連續的,所以即使戰略集合是有限的,也會有無限多個混合戰略。
8樓:匿名使用者
談到「納什均衡」,有位記者請納什用通俗的語言來解釋他的理論。納什說
;「『納什均衡』並不高深,它就像中國人發明的一種、三個人玩的撲克遊戲,「納什均衡」就是乙個簡單的三人博弈遊戲」。中國有那麼多人玩撲克,又玩了那麼多年,納什還提醒了中國人半個多世紀,納什均衡並不高深,中國人竟沒有乙個人發現三個人玩的撲克遊戲中、還有乙個『均衡佔優理論』。人們不禁要問;納什他自己玩過幾次三人撲克遊戲?
他和誰玩的?他是怎
麼發現的均衡?均衡理論又是怎麼單方佔優的?在他所有的文章中,為什麼沒有對中國的撲克遊戲敘述。
一副撲克三個人玩,乙個人18張牌,在連續記錄的0、1、2、三維系統中,18張牌只能記錄成、18個紅藍小點而已,它是怎麼個均衡法呢?我打乙個比喻,納什讓工人用磚給他鋪乙個場地,他只給了18塊磚......是不是太令人費解了。
2023年,美國東部時間1月30日,cmu開發的機器程式與四名職業玩家約戰賓夕法尼亞州匹茲堡大賭場,並在持續20天的比賽時間中,每天每人1500次押注,20天一人共押30000次,四人共玩了12萬次表示均衡,才能分出輸贏。18個紅藍小點咋均衡呢?納什均衡是什麼呢?
正常人不知道,只有神經病才知道。
他在60多年的時間裡,沒有人見過他、用中國的撲克表演過什麼是、非合作納什均衡,什麼是納什均衡佔優策略,他既沒有實際表演,也沒有給出明確的理論說明,這令關注納什佔優策略的人,大為失望。
博弈聖經著作人的經典名句;科學家在納什均衡理論中、尚未發現博弈佔優策略的任何跡象。
什麼是負債?能不能舉個例子
通俗的說,就是需要在以後的日期裡用你的財物或是勞務來償還的事項。比如說,你現在借銀行100萬,規定在一年以後還,所以這100萬在這一年內就是你們的負債,因為你們要在一年後用貨幣資金進行償還,當然了你們的資產 銀行存款 也增加了100萬,再比如說,你們購入一批材料10萬,合同規定在乙個月後付款,那麼這...
關於CTM的精通這個屬性,能不能簡單解釋下是幹什麼的
我覺得直觀地說 是對天賦的強化 具體的說明每個職業的每個天賦都有詳細的解釋 天賦裡面 檢視總覽 鳥德的精通是 是蝕星蔽月傷害加成提高16 每1點精通使得傷害加成再提高2 至於3圍 我覺得新版本的初期什麼都缺 只是有點小側重 智力就不說了 然後是命中 接著是急速吧 以上是個人意見 如需深入請至專門 論...
不知道到底能不能既簡單又快速的賺錢
簡單不忙想要賺錢很不易,但淘金團隊恰恰能做到,只是利用平時的空閒賺錢,閒下來就有錢可賺,何樂不為呢。有興趣的可以先免費註冊再體驗 我想在合肥開個藥店不知道能不能賺錢 晏制寐伊 及能不能賺錢涉及很多因素,主要看你自己資源是否滿足。1 能不能拿到售藥營業執照,不太好拿 2 進藥,渠道 3 成本投入 4 ...