囚徒困境是博弈論中一個(gè)非常著名的例子。
“ 兩個(gè)嫌疑犯作案后被警察抓住,分別關(guān)在不同的屋子里接受審訊。警察知道兩人有罪,但缺乏足夠的證據(jù)。警察告訴每個(gè)人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個(gè)坦白而另一個(gè)抵賴,坦白的放出去,抵賴的判十年。于是,每個(gè)囚徒都面臨兩種選擇:坦白或抵賴。然而,不管同伙選擇什么,每個(gè)囚徒的最優(yōu)選擇是坦白:如果同伙抵賴、自己坦白的話放出去,抵賴的話判一年,坦白比不坦白好;如果同伙坦白、自己坦白的話判八年,比起抵賴的判十年,坦白還是比抵賴的好。結(jié)果,兩個(gè)嫌疑犯都選擇坦白,各判刑八年。如果兩人都抵賴,各判一年,顯然這個(gè)結(jié)果好。”
單次和多次的囚徒困境,結(jié)果不會(huì)一樣。
在重復(fù)的囚徒困境中,博弈被反復(fù)地進(jìn)行。因而每個(gè)參與者都有機(jī)會(huì)去“懲罰”另一個(gè)參與者前一回合的不合作行為。這時(shí),合作可能會(huì)作為平衡的結(jié)果出現(xiàn)。欺騙的動(dòng)機(jī)這時(shí)可能被懲罰的威脅所克服,從而可能導(dǎo)向一個(gè)較好的、合作的結(jié)果。反復(fù)的、接近無限的重復(fù)次數(shù)時(shí),納什均衡趨向于帕累托最優(yōu),從互相背叛趨向于互相忠誠(chéng)。
我們開始做一些假設(shè),來重新看這個(gè)問題。
如果這兩個(gè)罪犯一個(gè)是宋高宗,一個(gè)是岳飛,猜猜他們會(huì)怎么選擇?
宋高宗第一次就選擇抵賴,岳飛坦白。
如果這兩個(gè)罪犯一個(gè)是斯大林,一個(gè)是他的保鏢,猜猜他們會(huì)怎么選擇?
保鏢第一次就選擇坦白,斯大林抵賴。
如果這兩個(gè)罪犯都是同一窩蜜蜂,一個(gè)是蜂王,一個(gè)是工蜂,猜猜他們會(huì)怎么選擇?
當(dāng)然蜜蜂不會(huì)被警察抓住,他們一般不犯警察感興趣的罪行。不過在遇到任何攻擊的時(shí)候,任何一只工蜂都會(huì)毫不猶豫地犧牲自己,保證蜂王的安全。而蜂王會(huì)毫不猶豫地逃生,以保證蜂群的持續(xù)生存。
囚徒困境之所以難,就是因?yàn)閮蓚€(gè)人如果選擇是基于對(duì)自己的利益最大化,那么答案極不確定。
我剛剛舉出的例子,都是設(shè)定了這兩個(gè)罪犯歸屬于同一個(gè)整體,而這兩個(gè)人對(duì)組織極其忠誠(chéng)。而代表整體未來的那個(gè)人毫不猶豫地選擇抵賴,另一個(gè)人坦白。
這就是整體的未來對(duì)人行為的影響力。
當(dāng)然,原來的例子中就說了如果這是一個(gè)重復(fù)發(fā)生的事件,那么選擇會(huì)慢慢趨近于最優(yōu)選。
而所謂重復(fù)發(fā)生,就是兩個(gè)人對(duì)整體未來有一個(gè)學(xué)習(xí)的過程。時(shí)間會(huì)教會(huì)在一起的一群人,學(xué)會(huì)怎么形成整體組織,來應(yīng)對(duì)外界的威脅。整體的未來是所有組織成員的共同指向。只要整體的未來和自己的未來一致,成員就很容易為了組織犧牲自己的利益。
盜墓者,常常遇到一個(gè)人跳進(jìn)坑里,另一個(gè)人要負(fù)責(zé)用繩子把拉他上來。此時(shí)出現(xiàn)的情況非常類似囚徒困境。因?yàn)樘诱呷绻l(fā)現(xiàn)了寶貝,而上面的人起了貪心,就容易在上面把他砸死,然后獨(dú)吞寶貝。而盜墓者發(fā)展出一個(gè)行業(yè)規(guī)則,就是父子搭檔,兒子跳坑,老子拉繩。理由非常簡(jiǎn)單,兒子代表老子的未來,老子不會(huì)毀滅自己的未來。如果老子跳坑,兒子拉繩,兒子就不一定會(huì)那么忠心。
囚徒困境,本身是一個(gè)現(xiàn)在利益選擇,加入“整體”和“未來”的概念,其實(shí)這個(gè)選擇不那么難。難是難在對(duì)整體未來的信任。