前回も1度、囚人のジレンマについて書きましたが、今回はより詳しく書いていきたいと思います(今回も僕が受けた授業の解説です)。ちなみにですが、囚人のジレンマはゲーム理論という経済学の分野に属しているとても有名な問題です。興味がある方は、前回の記事を参考にしてもらえばと思います。
今回の題材は、イギリスのGolden Ballsというバラエティー番組です(少し古いです(笑))。この番組では、最後に賞金を2人で分け合うゲームを行います。ゲームはとてもシンプルです。
二人の前にそれぞれ2つのボールが用意されています。中には、“split” または “steal”と書いてあります。2人がそれぞれ “split” を選べば、賞金を半分づつ分けることが出来ます。しかし、1人が “split” を選び、もう1人が “steal” を選ぶと、”steal” を選んだ人が賞金を総獲りすることが出来ます。ただ、2人とも “steal” を選ぶと、賞金は番組に没収されてしまいます。
さてどうすれば良いでしょうか。
この問題を解くために、利得表と言われるものを使ってみたいと思います。
(A, B)のAはPlayer 1の利得になります。BはPlayer 2の利得になります。つまりPlayer 1が”split”を選び、Player 2が”steal”を選んだ時、Player 1の利得は0%、Player 2の利得は100%を見ることが出来ます。
さて少し戻り、もう一度どのような戦略を取れば良いか考えます。Player 1にとって、相手が”split”を選んだ場合、利得を最大化できるのは”steal”を選ぶことです。
今度は、Player2が”steal”を選んだ場合について考えて見ます。Player1の利得はどちらを選んだ場合でも0%になってしまいます。
この場合、Player 1はどちらの戦略を取ろうが関係ないということになります。
ここまでを簡単に振り返ると、Player 2が”split”を選ぶならば、“steal”を選ぶべきであり、Player 2が”steal”を選んだ時はどちらを選んでも良いということです。ここで問題であるのは、Player 2がどちらを選ぶかは不確かということです。
Player 2がどちらを選ぶか分からない場合、Player1が自分の利得を最大化するために取るべき戦略は、”steal”を選ぶことです。
しかし、これと同じことをPlayer 2も考えます。そうすると、結果として起こるのは二人ともの利得が0%になるということです。これが囚人のジレンマと言われるものです。これは双方にとって良い結果ではありません。
ナッシュ均衡とは、各々が最適な戦略を取り、これ以上戦略を変える動機がない均衡点のことを言います。
また、ナッシュ均衡が常に双方にとって最適な均衡点とは限りません(今回の例から明らかですね)。この場合、2人にとって良い戦略は2人ともが”split”を選ぶことです。そうすれば、賞金を仲良く山分けすることが出来ます(笑)。
この状況に持って行くには、どうすればいいでしょうか。
それは、二人が戦略を選ぶ前に話し合いをする場を設けることです(この場合、協力ゲームという問題になります。これまでのものは非協力的ゲームに分類されます)。そうすることで、双方が”split”を選ぶことに同意すれば、仲良く山分けすることが出来ます。
しかし、ここで新たな問題が出てきます。相手の”split”を選ぶというコミットメントに対して、どれだけ信用力があるかということです。ただの、口約束に過ぎません(笑)。その気になれば、裏切り、”steal”を選ぶと賞金を総取り出来ます。
つまり、協力ゲームの場合、問題は自分のコミットメントをどれだけ信頼あるものにできるかということになります。実際に、番組では選ぶ前に2人で話す時間が設けられています。これによって、この単純なゲームが面白くなるというわけですね。
次にある興味深い例を実際に見てもらいたいと思います。ここからが本番ですね(笑)。
youtu.be少し簡単に要約をします。Player はIbrahamとNickです。そして、開始早々にNickが行ったコミットメントは彼が絶対に”steal”を選ぶというものです。
次に、Ibrahamaに”split”を選んでほしいと頼みます。そうして得た賞金を、後で山分けしようというものです。それでは、今からIbrahamが選ぶべき選択肢を考えて行きます。
このNickの奇妙な行為は、ゲーム理論で説明することが出来ます。この時Nickが行ったのは、奇妙な取引を打ち出しただけてでなく、このゲーム構造自体を変えたのです。
それでは、Nickが”steal”を選ぶというコミットメントを行った後の利得表を見てみましょう。
Nickは必ず”steal”を選ぶと言っているので上の様な利得表になります。この時、Ibrahamの利得はどちらの戦略を選ぼうにも関わらず必ず0%です。
Ibrahamが出来る最善のことは”split”を選び、Nickが本当に賞金を後で山分けしてくれる事を望むのみです。このようにして、Nickは巧妙にIbrahamが”split”を選ぶしかない状況を作り出したのです。
そして最後にNickが取った行動は“split”を選び、双方が”split”を選んだということになりました。2人は興味な方法で賞金を山分けすることに成功したのです。
この方法では、口約束するよりも、山分け出来る確率は高くなると思います。というのも、相手が裏切る可能性が少しでもある限り(この場合”steal”を選ぶこと)、自分が裏切ってやろうという気持ちが働くからです。
しかし、このNickの場合のコミットメントには、裏切る可能性というのがほぼありません。何故なら彼は自分の最適な戦略を取っているからです。彼が、意図的にこの作戦を思いついたかは定かではありませんが、とても良い作戦ですよね!
今回はこれで終わりです*1。ゲーム理論に興味を持ってもらえたら嬉しいです!また、コミットメントについても前回書いているので、もし興味がありましたら、読んでもらいたいです。
*1:指摘などがありましたら、是非お願いします