しっぺ返し戦略

フォーク定理 - Wikipedia

反復囚人のジレンマ・ゲームではしっぺ返し戦略が均衡解、最も優れた戦略となるから、利己主義者はしっぺ返し戦略、つまり応報主義者となる、といった理解がされているように思う。


しかし、よく考えてみたら、こういった反復囚人のジレンマ・ゲームでは、本物の利己主義者は存在しないのではないか? 敵対戦略を常に選択するプレーヤーは利己主義者ではなくたんなる敵対主義者で、協調戦略を常に選択するプレーヤーや利己主義者ではなくたんなる協調主義者であるように、応報を常に選択するプレーヤーは利己主義者ではなくたんなる応報主義者だろう。

たしかに、敵対主義者・協調主義者・応報主義者がある一定の割合で存在することを知っている利己主義者は、応報主義者として振舞うだろう。しかし、彼/彼女が真の利己主義者であれば、その割合が変化すれば別の戦略を選択するだろう(たとえば、カモである協調主義者が十分に多いという情報があれば、敵対主義者として振舞うだろう)。

では、そのような利己主義者が大多数の状況であることを知っていれば、プレーヤーはどう振舞うべきか? やはり、応報主義者として振舞うべきなのか? これは自明ではないように思う。

もはや単純なゲームを離れるが、これが自明ではないとしたら、利己主義者が十分に多い環境においては、利己主義者であるプレーヤーにとってベストな戦略は、状況が利己主義者ばかりではなく、利己主義者が応報主義者として振舞わざるをえないような割合で敵対主義者・協調主義者・応報主義者が混ざっているという情報が(それが事実であれ、事実でなかれ)流布させることではないかと思う。もし、そのような情報を流布させることに成功すれば、彼/彼女は十分に応報主義者が多いという状況と同じように、応報主義者として行動することによって最大の利得を得ることができるだろう。

これは、「利己主義者は『信用』という財産を得、維持するために善人として振舞う」ということは、プレーヤーが利己主義者ばかりで、プレーヤーが利己主義者ばかりだという情報がいきわたっている状況では成り立たないのではないか、ということだ。たぶん、次のどちらかの状況でしか、なりたたないだろう:

  • 「信用」を判断基準にする応報主義者が現実に十分にいる
  • 功利主義者が現実に十分にいて、かつ「信用」を判断基準にする応報主義者が十分にいるという情報が行き渡っている


そうすると、さらに厳密なゲームを離れるが、社会において利己主義者がとるべき戦略は、「応報主義者が有利になるような状況を作り出して、現実に応報主義者を増やす」か、「応報主義者が十分に多いという情報を流布させる」ということであるように思う。

・・・ん? そうすると、結局、利己主義者は応報主義者として振舞うことになるのか?