博弈論

千呼萬喚始出來,終于要寫我心心念念的博弈論了。說到博弈論大家心里肯都有兩個問題,

1、博弈論是什么?
2、學習博弈論有什么用?
博弈論是多個個體或群體在特定條件制約下,利用相關方的策略,而實施自身對應策略的學科。就好比下棋,敵我對弈,為獲得勝利,如何見招拆招。
那有什么用呢?生活中充滿著博弈,理解其中隱藏的規律,才能為我所用。通過對博弈論的學習,我得到一個結論,在現實生活中 多次重復博弈的前提下,“一報還一報”是最優策略!
善意為先,以直報怨,以德報德

640.webp.jpg

好了,寫到這我覺得自己已經把博弈論中學到的對自己有用的結論寫來了,而且我將堅定的按照這個規則執行。

如果有興趣進一步了解博弈論,例如 博弈論是怎么產生的?經歷了哪些發展過程?現代的博弈論是什么?還有剛剛我說的“一報還一報”是如何被實驗證實的?那就隨我繼續往下看。

博弈論的產生

(為什么要談博弈論的產生呢,所有的知識或理論,總有它開始的地方,如果想抓住其本質,就要從這里開始)

說到博弈論的產生不得不提一位大神,馮諾依曼,他可能是一個比愛因斯坦還要聰明的人!很小就精通多國語言,可以同聲傳譯,在數學、醫學、經濟學、計算機科學等多門學科都有所建樹。他一生對很多領域都有強烈的探索的興趣。博弈論就產生于他的一個偶然的興趣,有一天他想打撲克有沒有穩贏不輸的方法?于是出了《博弈論與經濟行為》一書,宣布了博弈論的誕生。

舉個簡單的栗子,梭哈(也就是比大小)
游戲規則:2-5個人圍在一起比大小,支付賭本后,每人一張底牌,底牌在對決時才可翻開。從發第二張拍,每發一張牌,以牌面者為先,進行下注。 有人下注,想繼續玩下去的人,選擇跟,跟注后會下注到和上家相同的籌碼,或可選擇加注,各家如果覺得自己的牌況不妙,不想繼續,可以選擇放棄,認賠等待牌局結束,先前跟過的籌碼,亦無法取回。

最后一輪下注是比賽的關鍵,在這一輪中,玩家可以進行梭哈,所謂梭哈是押上所有未放棄的玩家所能夠跟的最大籌碼。等到下注的人都對下注進行表態后,便掀開底牌一決勝負。這時,牌面最大的人可贏得桌面所有的籌碼。

這個時候應該怎么玩?手里拿到了大,中,小 牌時應如何應對?
1、拿到大牌時,一定想辦法贏得更多,誘敵深入,加注;
2、拿到中牌時, 直接翻牌,勝面不大的前提下,無論輸贏,降低風險;
3、拿到小牌時, 必須加注!為什么呢?從兩方面來看。一方面,不加注,必輸,加注可能贏;另一方面,要讓對方搞不清自我的套路,兵者詭道也,讓對方猜不出我是大牌加注還小牌加注。
這是博弈論在比大小中迎面比較大的策略。

至此我才知道,原來聲名赫赫的博弈論最初是從游戲中發展而來的,是在既定的規則下,雙方心理和智力的比拼。

博弈論中有意思的模型

囚徒困境

故事內容是,兩個嫌疑犯(A和B)作案后被警察抓住,隔離審訊;警方的政策是“坦白從寬,抗拒從嚴”,如果兩人都坦白則各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據不足各判1年。

· 若對方沉默,坦白會讓我獲釋,所以會選擇坦白。
· 若對方坦白指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇坦白。

這就是著名的囚徒困境,這個故事反映個人最佳選擇并非團體最佳選擇。

知道囚徒困境有什么用呢?如何破解囚徒困境?
囚徒困境用數學語言描述就是兩個條件:
1、背叛誘惑>合作報酬。在這里,合作報酬是判刑1年,而背叛誘惑卻是立即釋放。
2、受騙支付>背叛懲罰。在這里,背叛懲罰是判刑8年,而受騙支付卻是判刑15年。

看到這里,破解之法就顯而易見了,我們只要讓“背叛誘惑<合作報酬,受騙支付<背叛懲罰”就可以了。

背叛誘惑<合作報酬。即你幫大哥頂罪,家里的妻兒老小大哥都會幫你照顧,而且等你出來還會給你一筆錢;
受騙支付<背叛懲罰。即如果你敢揭發大哥,小心你全家性命。
納什平衡

是指在一個博弈過程中,無論對方采用什么策略,我都會選擇某個確定的最優策略,在這個博弈中誰單方改變策略,誰就會損失,納什平衡就是這種博弈的穩定結果。

囚徒困境就是一個很好的例證,它是一個壞的納什均衡。

學習納什平衡有什么用呢?如何破解壞的納什平衡呢?

還是以囚徒困境為例,如果兩個嫌疑犯事先有約定,都不坦白,如果有人背叛,則外面的其他兄弟會懲罰他。
即用制度去制約壞的納什平衡,讓其向好的方向發展。生活中的商業戰爭也是一樣,要善用協議約束,避免壞的納什平衡,實現共同利益最大化。
智豬博弈

兩頭豬,一頭大豬,一頭小豬,在一個狹長的豬圈中,踏板和食槽在兩端,踩下踏板食槽供食,一只豬踩踏板另一只豬就能坐享其成先吃,而踩踏板需要消耗能量。

具體情況如下:
如果兩只豬同時踩踏板,同時跑向食槽,大豬吃進7份,得益5份,小豬吃進3份,實得1份;
如果大豬踩踏板后跑向食槽,這時小豬搶先,吃進4份,實得4份,大豬吃進6份,付出2份,得益4份;
如果大豬等待,小豬踩踏板,大豬先吃,吃進9份,得益9份,小豬吃進1份,但是付出了2份,實得-1份;
如果雙方都懶得動,所得都是0。

這里的納什平衡是:大豬踩踏板,小豬不動。明顯是個小豬占優的策略。

了解智豬博弈有什么用呢?這個故事給了我們什么啟示?

如果把大豬比作大企業,小豬比作小企業,小企業要懂得合理搭便車,實施“占優策略”分得市場。大企業要懂得利用專利保護等制度設計,制約小企業占便宜。
公地悲劇

什么是公地悲劇?
在公共草原上,每個理性的牧羊人都追求個人利益最大化。但多放牧會帶來兩個結果,一是增加單只羊的收益,二是增加草原的負擔,可能導致過度放牧。但因為草原是公共的,每個牧羊人無法限制其他牧羊人的放牧,自己不放牧資源也會被其他人占用,每個人都追求個人利益最大化,導致過度放牧,草原退化,這就是公地悲劇。

了解公地悲劇有什么用?如何破解公地悲劇呢?

了解公地悲劇的根本原因是公共資源不占用就吃虧的感覺,每個人都想占便宜,這種撈一把的心態導致了公地悲劇。
用兩個方法去破解,一是公地私有化,就像小崗村,分田到戶。公地私有化后人們就失去了撈一把的心態;另一個是強監管,通過公共資源有償使用、許可證使用來管制,避免公地悲劇。
重復博弈

是指同樣結構的博弈重復許多次,它可以是對稱信息的博弈,也可以是不對稱信息的博弈;

了解重復博弈有什么用?

理解了重復博弈,才不會在意一城一池的得失,用時間的維度的丈量成敗。誠信是一種與這個世界重復博弈的心態。
當雙方是一錘子買賣時,很可能宰你沒商量。但如果把一次博弈變成重復博弈,總體利益就能抵抗住短期誘惑,大家就會更講誠信。
不完全信息博弈

區別于囚徒困境、納什平衡、智豬博弈、公地悲劇這些完全信息博弈,現實生活中很多博弈是不清楚對手的信息和策略的,像這種不了解對象特征、規則、策略等信息的博弈稱為不完全信息博弈。

了解不完全信息博弈有什么用?

在我們了解對方特性、游戲規則和常用策略的情況下,我們會如何博弈,當沒有這些信息,或者彼此不清楚對方是否知道這些信息的時候,如何博弈?

了解不完全信息博弈,可以通過制造信息不對稱,獲得策略優勢,例如“空城計”。也可以通過特定方法,刺探對方軍情,打破信息不對稱,為我方爭取策略優勢,如“木馬計”
維護和打破信息不對稱,是雙方的重要策略。
拍賣博弈

一架滿載飛機,有幾位重要旅客急需搭乘,如何用最少的代價,讓其他旅客讓出座位呢?
用拍賣博弈的策略,由低到高叫價,先叫先得。由于旅客彼此不知愿意下飛機的代價是多少錢,害怕錯失機會,都會搶先同意舉手。于是這種策略付出的代價最小。

拍賣博弈有什么用?

善用這種“不完全信息博弈”,激發博弈者們“自相殘殺”,讓時間最不值錢的旅客下飛機,獲得最高收益。
零和博弈

是指參與博弈的雙方在嚴格競爭的環境下,一方獲益必然導致另一方損失,獲益和損失之和永遠為零。雙方不存在合作可能。

學習零和博弈有什么用?如何避免零和博弈?

零和博弈會導致你死我活的內部競爭,但往博弈中加入增量,零和博弈就會變成正和博弈。先確定“存量分配規則”、“利益分配機制”,不容博弈發生,打開封閉系統,注入新的元素,這樣創業公司才不會只盯著已經賺得的錢如何分,而是在既定利益分配機制的前提下,想如何擴大盤子賺更多的錢。
一報還一報

美國密西根大學教授羅伯特·阿克塞爾羅德做了一個博弈實驗,他寫信給不同背景的學者,請他們把應對“囚徒困境”的策略寫成程序,讓這些程序捉對廝殺,經過十幾萬次的重復博弈,最終“一報還一報”的策略獲得了勝利。

這個實驗讓我更加堅定,在生活中要秉持善行,用懲罰回報惡行,用善行回報善行;
在沒有被欺騙之前永遠不要主動欺騙他人。如果對手選擇背叛,立刻反擊。如果對手補償,不計前嫌繼續合作。這樣的清晰規則會激發對手的合作動機。是長期博弈最有利的策略。

寫在最后,最近寫作的過程中我的觀念又發生了些變化,是受我的 parter 黃sir 的影響(哈哈,我自己偷偷給她取的外號)。我一直喜歡寫大而全的東西,但這種東西真的不好寫,容易鋪的太廣而寫不透,而且很燒腦。

她是每天堅持寫作,而且最近看她的文章寫的越來越好,我們都訂閱了老師的專欄,而我可能聽聽就過了,她會聽完記下來,而且結合到自己生活中的小事,寫出感想。這點觸動了我。所以我想試試,從一個個小靈感小啟發開始寫,積累一個個小故事,一次只說清楚一件事。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,882評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,208評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,746評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,666評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,477評論 6 407
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,960評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,047評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,200評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,726評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,617評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,807評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,327評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,049評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,425評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,674評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,432評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,769評論 2 372

推薦閱讀更多精彩內容

  • 大家早安、午安、晚安,今天我先從機器學習的學習中休息一下,來了解一些常見的博弈論模型,然后繼續學習機器學習等。以下...
    keepStriving閱讀 46,817評論 3 72
  • 博弈論是二人或多人在平等的對局中,各自利用對方的策略變換自己的對抗策略,達到取勝的目的。有以下幾個模型: 囚徒困境...
    微芳閱讀 1,669評論 0 4
  • 文/土豆書生 晨陽起了 我在地平線等你 夕陽墜了 我在月影里等你 秋葉落了 我在滿地的金黃里 想象你...
    牧馬天山閱讀 265評論 0 1
  • 孩子別怕,這世界還有愛 文 / 涼爽 “志愿者官網”微信公眾號發布了一篇文章,《又現虐童視頻,跪求轉發找到受虐女孩...
    楊靖心理閱讀 520評論 0 0
  • 雨,自清晨始就未停歇。時大時小,忽急忽緩。 銀川的初夏仍然躑躅在暮春的節奏里,陰雨綿綿中依舊延續著春寒料峭的感覺。...
    介山散人閱讀 227評論 0 0