囚人のジレンマ(prisoner's-dilemma)

囚人のジレンマ

囚人のジレンマ』は『ゲーム理論』における『非ゼロサム・ゲーム』の代表的な理論の一つです。

自分にとって利益の大きい選択をすると、協力した場合よりも損失が増えてしまうゲーム(やり取り)となっています。

容疑者Aと容疑者Bの間で行われるゲームです。

二人の容疑者はある犯罪の疑いがかけられましたが、証拠はまだ見つかっていません。
そこで警察は、二人をそれぞれ別の部屋に入れ、意思疎通が出来ないようにした上で、ある提案を持ち掛けます。

  • AとBの両方が自白すれば<懲役は5年>
  • AとBの両方が自白しなければ<懲役は2年>
  • 片方が自白し、もう片方が自白しなかったら、自白した方は<無罪>、自白しなかった方は<懲役10年>
囚人のジレンマ
囚人のジレンマ

あなたが容疑者Aならどの選択をされますか?

これは、容疑者Aが<無罪>を狙い自白するを選ぶと、容疑者Bが自白した場合<懲役5年>となります。
両方が自白したことによる<懲役5年>は、両方が自白しなかった場合の<懲役2年>に比べて長くなり、損失となります。

このように片方が自身の利益だけを追求すると、協力する行動をとる時よりも損失が増えてしまうことになります。

そのため、この場合の選択肢としては、両方が自白しないことが良い選択(『パレート最適』)ではないかと考えられています。

しかし、現実問題として、容疑者Aが自白しない選択をすると、容疑者Bが自白してしまったときに容疑者Aは<懲役10年>となってしまいます。
そのため、容疑者Aはそのリスクを避けるため、自白という選択を取らざるを得なくなります(『ナッシュ均衡』)。

お互いにリスクのある状況ではこのような矛盾が生まれます。
このような状況などで、人がどのように協力関係、もしくは対立関係を選択するのかを理解するためにゲーム理論が生み出されていきました。

パレート最適

パレート最適は、複数ある組み合わせのなかで全体の利得が最大となる組み合わせのことです。

囚人のジレンマでは、両方とも自白せず、互いに<懲役2年>となることがパレート最適になります。

ナッシュ均衡

ナッシュ均衡とは、自分の選択を変更しても高い利益が得られない状態のことです。

相手が個人の利益を追求するリスクを回避するために、自分も自身に利益のある選択をすることとなります。

つまり、囚人のジレンマにおいては、相手が自身の利益(自白して<無罪>)を得ようとする危険があるので、自分も自身の利益(自白せずに<懲役10年>よりも、自白して<懲役5年>)を選ばざるを得ないという状態です。

パレート最適ナッシュ均衡の関係

パレート最適(全体の利益を取ろうとする判断)は、ナッシュ均衡(個々人の利益をとろうとする合理的判断)と衝突する時があります。

この矛盾について説明している理論が囚人のジレンマとなります。

囚人のジレンマだけでは、わかりづらいかもしれないため、争いを例にして書きたいと思います。

A国とB国の間で、争いが起きようとしています。
それぞれの国には1000万人の人がいたとします。

  • A国とB国がともに、争いを始めれば、両国ともに500万人の犠牲が出ます。
  • A国とB国がともに、争いを回避すれば、両国とも犠牲は出ません。
  • 片方の国が争いをはじめ、片方が争いを避けようとすれば、争いを始めた国の犠牲はなく、争いを避けた国が滅びます。
非ゼロサムゲームの例題について表にまとめた。
非ゼロサム・ゲーム

この時、パレート最適を選ぶと争いは生じず誰も犠牲になりませんが、相手が争いを仕掛けてきて、自国が滅びるリスクを避けようとすれば、争う選択(ナッシュ均衡)をとることになります。

非常に極端な例ではありますが、個人間だけでなく、様々な集団間で行われるやり取りに対しても分析し、理解しようとする理論となっております。

氏原寛編(2004)『心理臨床大事典』改定版, 培風館.

この記事を書いた人

上岡晶の画像

臨床心理士・公認心理師
上岡 晶
Ueoka Sho

精神科・心療内科での勤務を経て、2023年から「オンラインカウンセリングおはぎ」を開業しました。私のカウンセリングを受けてくださる方が少しでも望まれる生活を送れるように、一緒に歩んでいきたいと考えています。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA