兩個合伙犯罪被警察抓住的犯罪嫌疑人,一開始拒不認罪,后來警察將他們獨立關押和審訊,并分別告訴他們中的一個人:如果只其一人坦白將立即釋放,如果雙方都坦白則每人坐8年牢,都不坦白則每人判1年,若是另一個人單獨坦白則其將判十年。兩個犯罪嫌疑人面臨的情境就是著名的“囚徒困境”。
在囚徒困境中,如果一方選擇坦白,他將有可能當庭釋放(另一人不坦白)或者判8年(另一人坦白);而如果選擇不坦白,他將有可能被判一年(另一人不坦白)或者判十年(另一人坦白)。所以他們考慮再三,紛紛選擇坦白,因為無論對方的選擇如何,獲得的刑罰都比不坦白要小一些。但聰明反被聰明誤,最終兩人互相算計而導致雙方都判了8年。
所以博弈論不考慮概率,不考慮道德,只是以實現本身利益最大化為目標。
如何破解囚徒困境呢?產生囚徒困境的前提是警察將他們隔離開來,如果讓他們互相溝通,自然就不存在這個困境,所以走出囚徒困境的方法就是博弈的雙方進行合作。如果兩個囚徒串通好都不坦白,則都將只判一年,是最優化的策略。