千呼萬喚始出來,終于要寫我心心念念的博弈論了。說到博弈論大家心里肯都有兩個問題,
1、博弈論是什么?
2、學習博弈論有什么用?
博弈論是多個個體或群體在特定條件制約下,利用相關方的策略,而實施自身對應策略的學科。就好比下棋,敵我對弈,為獲得勝利,如何見招拆招。
那有什么用呢?生活中充滿著博弈,理解其中隱藏的規律,才能為我所用。通過對博弈論的學習,我得到一個結論,在現實生活中 多次重復博弈的前提下,“一報還一報”是最優策略!
善意為先,以直報怨,以德報德。
好了,寫到這我覺得自己已經把博弈論中學到的對自己有用的結論寫來了,而且我將堅定的按照這個規則執行。
如果有興趣進一步了解博弈論,例如 博弈論是怎么產生的?經歷了哪些發展過程?現代的博弈論是什么?還有剛剛我說的“一報還一報”是如何被實驗證實的?那就隨我繼續往下看。
博弈論的產生
(為什么要談博弈論的產生呢,所有的知識或理論,總有它開始的地方,如果想抓住其本質,就要從這里開始)
說到博弈論的產生不得不提一位大神,馮諾依曼,他可能是一個比愛因斯坦還要聰明的人!很小就精通多國語言,可以同聲傳譯,在數學、醫學、經濟學、計算機科學等多門學科都有所建樹。他一生對很多領域都有強烈的探索的興趣。博弈論就產生于他的一個偶然的興趣,有一天他想打撲克有沒有穩贏不輸的方法?于是出了《博弈論與經濟行為》一書,宣布了博弈論的誕生。
舉個簡單的栗子,梭哈(也就是比大小)
游戲規則:2-5個人圍在一起比大小,支付賭本后,每人一張底牌,底牌在對決時才可翻開。從發第二張拍,每發一張牌,以牌面者為先,進行下注。 有人下注,想繼續玩下去的人,選擇跟,跟注后會下注到和上家相同的籌碼,或可選擇加注,各家如果覺得自己的牌況不妙,不想繼續,可以選擇放棄,認賠等待牌局結束,先前跟過的籌碼,亦無法取回。
最后一輪下注是比賽的關鍵,在這一輪中,玩家可以進行梭哈,所謂梭哈是押上所有未放棄的玩家所能夠跟的最大籌碼。等到下注的人都對下注進行表態后,便掀開底牌一決勝負。這時,牌面最大的人可贏得桌面所有的籌碼。
這個時候應該怎么玩?手里拿到了大,中,小 牌時應如何應對?
1、拿到大牌時,一定想辦法贏得更多,誘敵深入,加注;
2、拿到中牌時, 直接翻牌,勝面不大的前提下,無論輸贏,降低風險;
3、拿到小牌時, 必須加注!為什么呢?從兩方面來看。一方面,不加注,必輸,加注可能贏;另一方面,要讓對方搞不清自我的套路,兵者詭道也,讓對方猜不出我是大牌加注還小牌加注。
這是博弈論在比大小中迎面比較大的策略。
至此我才知道,原來聲名赫赫的博弈論最初是從游戲中發展而來的,是在既定的規則下,雙方心理和智力的比拼。
博弈論中有意思的模型
囚徒困境
故事內容是,兩個嫌疑犯(A和B)作案后被警察抓住,隔離審訊;警方的政策是“坦白從寬,抗拒從嚴”,如果兩人都坦白則各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白則因證據不足各判1年。
· 若對方沉默,坦白會讓我獲釋,所以會選擇坦白。
· 若對方坦白指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇坦白。
這就是著名的囚徒困境,這個故事反映個人最佳選擇并非團體最佳選擇。
知道囚徒困境有什么用呢?如何破解囚徒困境?
囚徒困境用數學語言描述就是兩個條件:
1、背叛誘惑>合作報酬。在這里,合作報酬是判刑1年,而背叛誘惑卻是立即釋放。
2、受騙支付>背叛懲罰。在這里,背叛懲罰是判刑8年,而受騙支付卻是判刑15年。
看到這里,破解之法就顯而易見了,我們只要讓“背叛誘惑<合作報酬,受騙支付<背叛懲罰”就可以了。
背叛誘惑<合作報酬。即你幫大哥頂罪,家里的妻兒老小大哥都會幫你照顧,而且等你出來還會給你一筆錢;
受騙支付<背叛懲罰。即如果你敢揭發大哥,小心你全家性命。
納什平衡
是指在一個博弈過程中,無論對方采用什么策略,我都會選擇某個確定的最優策略,在這個博弈中誰單方改變策略,誰就會損失,納什平衡就是這種博弈的穩定結果。
囚徒困境就是一個很好的例證,它是一個壞的納什均衡。
學習納什平衡有什么用呢?如何破解壞的納什平衡呢?
還是以囚徒困境為例,如果兩個嫌疑犯事先有約定,都不坦白,如果有人背叛,則外面的其他兄弟會懲罰他。
即用制度去制約壞的納什平衡,讓其向好的方向發展。生活中的商業戰爭也是一樣,要善用協議約束,避免壞的納什平衡,實現共同利益最大化。
智豬博弈
兩頭豬,一頭大豬,一頭小豬,在一個狹長的豬圈中,踏板和食槽在兩端,踩下踏板食槽供食,一只豬踩踏板另一只豬就能坐享其成先吃,而踩踏板需要消耗能量。
具體情況如下:
如果兩只豬同時踩踏板,同時跑向食槽,大豬吃進7份,得益5份,小豬吃進3份,實得1份;
如果大豬踩踏板后跑向食槽,這時小豬搶先,吃進4份,實得4份,大豬吃進6份,付出2份,得益4份;
如果大豬等待,小豬踩踏板,大豬先吃,吃進9份,得益9份,小豬吃進1份,但是付出了2份,實得-1份;
如果雙方都懶得動,所得都是0。
這里的納什平衡是:大豬踩踏板,小豬不動。明顯是個小豬占優的策略。
了解智豬博弈有什么用呢?這個故事給了我們什么啟示?
如果把大豬比作大企業,小豬比作小企業,小企業要懂得合理搭便車,實施“占優策略”分得市場。大企業要懂得利用專利保護等制度設計,制約小企業占便宜。
公地悲劇
什么是公地悲劇?
在公共草原上,每個理性的牧羊人都追求個人利益最大化。但多放牧會帶來兩個結果,一是增加單只羊的收益,二是增加草原的負擔,可能導致過度放牧。但因為草原是公共的,每個牧羊人無法限制其他牧羊人的放牧,自己不放牧資源也會被其他人占用,每個人都追求個人利益最大化,導致過度放牧,草原退化,這就是公地悲劇。
了解公地悲劇有什么用?如何破解公地悲劇呢?
了解公地悲劇的根本原因是公共資源不占用就吃虧的感覺,每個人都想占便宜,這種撈一把的心態導致了公地悲劇。
用兩個方法去破解,一是公地私有化,就像小崗村,分田到戶。公地私有化后人們就失去了撈一把的心態;另一個是強監管,通過公共資源有償使用、許可證使用來管制,避免公地悲劇。
重復博弈
是指同樣結構的博弈重復許多次,它可以是對稱信息的博弈,也可以是不對稱信息的博弈;
了解重復博弈有什么用?
理解了重復博弈,才不會在意一城一池的得失,用時間的維度的丈量成敗。誠信是一種與這個世界重復博弈的心態。
當雙方是一錘子買賣時,很可能宰你沒商量。但如果把一次博弈變成重復博弈,總體利益就能抵抗住短期誘惑,大家就會更講誠信。
不完全信息博弈
區別于囚徒困境、納什平衡、智豬博弈、公地悲劇這些完全信息博弈,現實生活中很多博弈是不清楚對手的信息和策略的,像這種不了解對象特征、規則、策略等信息的博弈稱為不完全信息博弈。
了解不完全信息博弈有什么用?
在我們了解對方特性、游戲規則和常用策略的情況下,我們會如何博弈,當沒有這些信息,或者彼此不清楚對方是否知道這些信息的時候,如何博弈?
了解不完全信息博弈,可以通過制造信息不對稱,獲得策略優勢,例如“空城計”。也可以通過特定方法,刺探對方軍情,打破信息不對稱,為我方爭取策略優勢,如“木馬計”
維護和打破信息不對稱,是雙方的重要策略。
拍賣博弈
一架滿載飛機,有幾位重要旅客急需搭乘,如何用最少的代價,讓其他旅客讓出座位呢?
用拍賣博弈的策略,由低到高叫價,先叫先得。由于旅客彼此不知愿意下飛機的代價是多少錢,害怕錯失機會,都會搶先同意舉手。于是這種策略付出的代價最小。
拍賣博弈有什么用?
善用這種“不完全信息博弈”,激發博弈者們“自相殘殺”,讓時間最不值錢的旅客下飛機,獲得最高收益。
零和博弈
是指參與博弈的雙方在嚴格競爭的環境下,一方獲益必然導致另一方損失,獲益和損失之和永遠為零。雙方不存在合作可能。
學習零和博弈有什么用?如何避免零和博弈?
零和博弈會導致你死我活的內部競爭,但往博弈中加入增量,零和博弈就會變成正和博弈。先確定“存量分配規則”、“利益分配機制”,不容博弈發生,打開封閉系統,注入新的元素,這樣創業公司才不會只盯著已經賺得的錢如何分,而是在既定利益分配機制的前提下,想如何擴大盤子賺更多的錢。
一報還一報
美國密西根大學教授羅伯特·阿克塞爾羅德做了一個博弈實驗,他寫信給不同背景的學者,請他們把應對“囚徒困境”的策略寫成程序,讓這些程序捉對廝殺,經過十幾萬次的重復博弈,最終“一報還一報”的策略獲得了勝利。
這個實驗讓我更加堅定,在生活中要秉持善行,用懲罰回報惡行,用善行回報善行;
在沒有被欺騙之前永遠不要主動欺騙他人。如果對手選擇背叛,立刻反擊。如果對手補償,不計前嫌繼續合作。這樣的清晰規則會激發對手的合作動機。是長期博弈最有利的策略。
寫在最后,最近寫作的過程中我的觀念又發生了些變化,是受我的 parter 黃sir 的影響(哈哈,我自己偷偷給她取的外號)。我一直喜歡寫大而全的東西,但這種東西真的不好寫,容易鋪的太廣而寫不透,而且很燒腦。
她是每天堅持寫作,而且最近看她的文章寫的越來越好,我們都訂閱了老師的專欄,而我可能聽聽就過了,她會聽完記下來,而且結合到自己生活中的小事,寫出感想。這點觸動了我。所以我想試試,從一個個小靈感小啟發開始寫,積累一個個小故事,一次只說清楚一件事。