請問零和博弈最多只能有納什均衡嗎

2021-03-06 16:09:02 字數 3421 閱讀 2539

1樓:匿名使用者

**:美國資訊網;博弈聖經著作人對納什的嘲諷

2樓:匿名使用者

一次博弈最終總會形成乙個結果,好比討價還價,這就是博弈均衡。"納什均衡"是一種最常見的、也是最重要的博弈均衡。它是美國天才數學家納什在2023年正在攻讀博士學位時提出來的,**題為《n人博弈的均衡問題》。

納什巧妙運用數學技巧,證明了如下定理:對一任何乙個n人參與的非合作博弈(零和或非零和),如果每個參與者的策略是有限的,那麼一定存在至少乙個納什均衡解集。該**只有短短一頁紙,但卻成了博弈論的經典文獻,並使他獲得了諾貝爾經濟學獎。

"納什均衡"的經典案例是"囚徒困境":兩個作案嫌疑人分別關在兩件牢房,警察告知,如果兩人都招供,則各坐牢3年;如果兩人都不招供,則放出;如果一人招供而另一人不招供,則招供的坐牢3年,不招供的坐牢10年。局外人看來,最好兩人都不招供。

但從每個人來看,招與不招的代價分別為與,還是招供為好。

但從納什均衡卻得出乙個悖論:單個人的最優選擇卻沒有導致全域性最佳的結果。現實中的例子很多,如**戰的結果是兩敗俱傷。

"納什均衡"證明了乙個道理:非合作博弈的情況下困境無法解脫。

納什均衡,nash equilibrium ,又稱為非合作博弈均衡,是博弈論的乙個重要術語,以約翰·納什命名。約翰·納什2023年作為年輕數學博士生進入普林斯頓大學。其研究成果見於題為《非合作博弈》(1950)的博士**。

該博士**導致了《n人博弈中的均衡點》(1950)和題為《非合作博弈》(1951)兩篇**的發表。納什在上述**中,介紹了合作博弈與非合作博弈的區別。他對非合作博弈的最重要貢獻是闡明了包含任意人數局中人和任意偏好的一種通用解概念,也就是不限於兩人零和博弈。

該解概念後來被稱為納什均衡。

假設有n個局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的最優策略(個人最優策略可能依賴於也可能不依賴於他人的戰略),從而使自己效用最大化。所有局中人策略構成乙個策略組合(strategy profile)。納什均衡指的是這樣一種戰略組合,這種策略組合由所有參與人最優策略組成。

即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。

納什均衡經典案例:囚徒困境

(2023年,數學家塔克任史丹福大學客座教授,在給一些心理學家作講演時,講到兩個囚犯的故事。)

假設有兩個小偷a和b聯合犯事、私入民宅被警察抓住。**將兩人分別置於不同的兩個房間內進行審訊,對每乙個犯罪嫌疑人,**給出的政策是:如果乙個犯罪嫌疑人坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪。

如果另乙個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另乙個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則**因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。表2.

2給出了這個博弈的支付矩陣。

表2.2 囚徒困境博弈

——————————————————————————

┃ b ┃ b ┃

————————┃————————┃————————┃

┃ 坦白 ┃ 抵賴 ┃

————————┃————————┃————————┃

a 坦白 ┃ –8, –8 ┃ 0, –10 ┃

————————┃————————┃————————┃

a 抵賴 ┃ –10, 0 ┃ –1, –1 ┃

————————┃————————┃————————┃

關於案例,顯然最好的策略是雙方都抵賴,結果是大家都只被判1年。但是由於兩人處於隔離的情況,首先應該是從心理學的角度來看,當事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當·斯密的理論,假設每個人都是「理性的經濟人」,都會從利己的目的出發進行選擇。這兩個人都會有這樣乙個盤算過程:

假如他坦白,我抵賴,得坐10年監獄,坦白最多才8年;他要是抵賴,我就可以被釋放,而他會坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了划算。兩個人都會動這樣的腦筋,最終,兩個人都選擇了坦白,結果都被判8年刑期。

基於經濟學中rational agent的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被釋放就不會出現。這樣兩人都選擇坦白的策略以及因此被判8年的結局,納什均衡」首先對亞當·斯密的「看不見的手」的原理提出挑戰:按照斯密的理論,在市場經濟中,每乙個人都從利己的目的出發,而最終全社會達到利他的效果。

但是我們可以從「納什均衡」中引出「看不見的手」原理的乙個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。

那位高人能簡明扼要介紹一下博弈論和納什均衡?

3樓:夢遊華胥

博弈即game,也就是遊戲,所有的遊戲都有賭一把的性質,

都要通過預設他人行為來安排自己行為,你沒有懸賞分我為什麼要回答,因為我也在博弈,當我回答,我自己也得到了滿足,達到了帕累託改進,這個過程沒有誰吃虧,而且這個過程也有納什均衡點,如果你會喜歡我的答案的話,納什均衡即博弈中的共同利益最大化。

4樓:匿名使用者

博弈就是指某個個人或是組織,面對一定的環境條件,在一定的規則約束下,依靠所掌握的資訊,從各自選擇的行為或是策略進行選擇並加以實施,並從各自取得相應結果或收益的過程。

而納什均衡就是說在這一均衡中,每個博弈參與人都確信,在給定其他參與人戰略決定的情況下,他選擇了最優戰略以回應對手的戰略。並且在對手策略不變的情況下,你自己的支付最少(當然,前提是在博弈中,人是理性的)。

納什均衡點,應怎樣理解

5樓:自治區區

納什平衡,又稱為非合作賽局平衡,是博弈論的乙個重要概念,以約翰·納什命名。

6樓:

……一開始我也以為是說史蒂夫納什……進來才發現不是……

7樓:匿名使用者

經典的例子就是囚徒困境,囚徒困境是乙個非零和博弈。 大意是:乙個案子的兩個嫌疑犯被分開審訊,警官分別告訴兩個囚犯,如果你招供,而對方不招供,則你將被判刑一年,而對方將被判刑十年;如果兩人均招供,將均被判刑五年。

於是,兩人同時陷入招供還是不招供的兩難處境。如果兩人均不招供,將最有利,只被判刑三年。 但兩人無法溝通,於是從各自的利益角度出發,都依據各自的理性而選擇了招供, 這種情況就稱為納氏均衡點。

這時,個體的理性利益選擇是與整體的理性利益選擇不一致的。 囚犯甲的博弈矩陣 囚犯甲 招供 不招供 囚犯乙 招供 判刑五年 甲判刑十年;乙判刑一年 不招供 甲判刑一年;乙判刑十年 甲判刑三年 基於經濟學中rational agent的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判刑三年就不會出現。事實上,這樣兩人都選擇坦白的策略以及因此被判五年的結局被是「納什均衡」(也叫非合作均衡),換言之,在此情況下,無一參與者可以「獨自行動」(即單方面改變決定)而增加收穫。

8樓:匿名使用者

steve nash打球很全面哈

就這麼理解

為什麼鼻貼和黑頭匯出液一星期最多只能用兩次

因為經常使用或者頻繁使用會導致鼻部的毛孔變大,而且因為是粘在鼻子上,所以撕下來的時候對 的損傷是很大的,頻繁使用會使 變薄甚至脫皮,這樣子 本身的自我屏障自我免疫的功能就喪失了。而另外的毛孔變大反而會形成異物堆積,更加需要清理。反而會形成惡性迴圈。所謂的毛孔收縮水只是在一定程度上減輕毛孔擴大的程度,...

請問北京和上海哪個城市的人口最多

散人無居 調查顯示 來自1 人口抽樣調查的資料顯示,2005年底北京市常住人口 在京居住半年以上人口 為1538萬人,4個城區 4個近郊區 10個遠郊區縣的人口占全市常住人口的比重分別為13.4 48.6 和38 與2000年相比,分別下降了3.4 增加了1.5 和增加了14.9 其中,朝陽區為人口...

請問 爽滑倍潤和ZERO零感 超薄超潤相比,哪個潤滑劑更多

爽 滑 倍 潤 更 多 一 些 但 z e r o 零 感 超 薄 超 潤 更 薄 一 些 這 兩 個 不 具 備 可 比 性 還內 是 要 根 據 實 際 需 求 來 選 擇容 合 適 的 避 孕 套 經 常 用 傑 士 邦 的 產copy 品 這 兩 款 產 品 都 添 加 了 潤 滑 劑 但 ...