武器になる「状況判断力」(21)

各行動方針の分析でゲーム理論を活用する

━━━━━━━━━━━━━━━━━━━━━━━

□はじめに

前回の謎解きは、冬場になると売れる「家庭用永久磁石磁気治療器をお堅い厚労省は科学的根拠がないにもかかわらず、なぜ効果を認め、医療機器として認可したのか?」でした。

アンケート結果で「効果あり」と回答した者が90%以上いたとの論文などに基づいて、厚労省は治療器として認可したとされています。認可しなければ、実際に効果があるのになぜ認可しないのかというクレームが出ることになります。

ただし、買う人は「効く」と前向きに考えた人で、しかもアンケートに答える人は「効いた」と納得した人が大半なので、90%以上という数値にどれほどの信ぴょう性があるかは疑問だとの指摘があります。

効き目のない薬でも、患者さん自身が、この薬は効き目があると思い込んで飲むことで、病気の症状が改善することがあるようです。これを「プラセボ(偽薬)効果」と言います。

逆に「病は気から」といって、どこも悪くないのに、病気だと思い込むことで本当の病気になることもあるようです。

 思い込みがプラスに働けば良いのですが、マイナスになることもあります。やはり複数の情報を集めて自分で冷静に判断することが重要です。

今回の謎解きは、「うなぎ屋、焼き鳥屋の秘伝のタレは、〇〇時代からずっと同じものであっても、なぜ腐らないのか?」です。

 さて、前回は我が行動方針を考える上での秘訣として、整合性、可能性、受容性の3つの物差し(基準)を紹介しましたが、今回は敵の可能行動と我が行動方針を掛け合わせる対抗シミュレーションについて、ゲーム理論をも踏まえて解説します。

▼我が「各行動方針」の分析

第2段階「状況および行動方針」では敵の可能行動と我が行動方針の列挙を行ないます。次は、第3段階の「各行動方針の分析」と第4段階の「各行動方針の比較」を行なって、第5段階の「結論」となります。

軍隊式「状況判断」では、第1段階の「任務分析」と第2段階「状況及び行動方針」で時間と労力を使います。ここまでに相当に分析していますので、分析結果を踏まえて、第4段階以降は粛々と行なうことになります。

各行動方針とは、列挙した我の行動方針のことです。分析は、敵の可能行動が各行動方針にどのような影響を及ぼすかを考察します。このため、敵の可能行動と我の各行動方針を組み合わせて、戦況がどのように推移し、戦闘の様相がどうなるかなどを対抗シミュレーションで考えます。

このような分析を経て、各行動方針の特性や問題点を浮き彫りにし、各行動方針の実行の可能度や対策を明らかにします。

各行動方針の分析では、マトリックス分析が用いられます。つまり、左側の縦列に敵の可能行動を列挙し、次に上の横列に我の行動方針を列挙していきます。そして、双方が対抗した場合の予想結果をマトリックスの交差部分に記録していきます。

 前回の日露戦争の事例では、縦列1段に「バルチック艦隊が対馬海峡を通過する(E-1)」、同2段に「バルチック艦隊が津軽海峡を通過する(E-2)」を列挙します。

 そして、横列の第1項目に「鎮海湾で待機(O-1)」、第2項目に「隠岐島または七尾湾で待機(O-2)」、そして第3項目に「むつ湾で待機(O-3)」を記載し、計6つの交差する升目で戦況推移や戦闘の様相を記述します。

▼ゲーム理論を活用する

各行動方針の分析では、数理分析法として「ゲーム理論」をはじめとするいくつかの方式が存在します。

米軍から流入した軍隊式「状況判断」は、敵と我は相互に相手を撃滅することを狙っているので、ここでのゲーム理論は「ゼロサムゲーム」となります。

これは、「利益が競合する(相容れない)2人以上のプレイヤーがどのような状況判断を行なうか」の説明でよく用いられる理論です。

現実の社会での状況判断や情勢判断では、さまざまなプレイヤーが利益を求めて競争しますので、ゲーム理論のバリエーションを押さえておくことは重要です。

そこで、ここでゲーム理論について少しばかり言及します。

 ゲーム理論は、数学者であるジョン・フォン・ノイマン(1903~1957年)がその基礎を築いたとされます。ノイマンは利害が完全に対立している場合には、合理的な解決策があることを数学的に証明してみせました。

ゲーム理論は、もともと経済学の分野で使われていましたが、日常生活からビジネス上の問題、あるいは国家間の問題に関しても有用です。なぜならば、これらの問題には、プレイヤー同士が相容れない要求を持っている状況がしばしば生起するからです。

ゲーム理論は、プレイヤー全員にとって最もよい選択は何かを数学的に導き出すものです。

 交渉事は、自分も得をして相手も得をする「WinWin」の関係があれば成立します。一方、自分だけが得をする、逆に相手だけが得をして自分の利益がない、これでは交渉が成立する余地はありません。

ゲーム理論の代表的なモデルには、「チキンゲーム」(※1)「囚人のジレンマ」(※2)や「鹿追ゲーム」(※3)があります。

これらのゲームでは、双方が意思疎通を欠き、信頼感がない場合には、双方は協調して大きな利益を上げることよりも、自分だけの最低限の利益を確保する傾向があります。つまり、行動はしばしば相手に対する「裏切り行為」となって現れます。

▼チキンゲームとは何か?

チキンゲームは交渉のための重要な基本原理です。このゲームでの最適行動は相手の行動に依存します。各プレイヤーはそれぞれの戦略をとります。各プレイヤーの一方が譲歩しない限り、悲劇的な結末は避けられません。

相手が譲歩しないとわかれば、もう一方は「譲歩した方が得である」と考え、衝突を回避することで受ける“屈辱”は、衝突によって損害を受けることに比べれば小さなことになります。よって、衝突を事前に回避する行動方針(譲歩)が合理的な行動方針となります。

逆に、相手には譲歩する戦略しかないとわかれば、もう一方は譲歩する必要はありません。すなわち、意志の貫徹が行動方針となるのです。

作戦戦場では短期間に敵と我との対抗シミュレーションが進展するために、このようにゲーム理論に基づく駆け引きが行なわれることは少ないでしょう。
しかし、国際問題やビジネスでの対抗シミュレーションではゲーム理論は役立ちます。

1962年のキューバ危機において、ケネディ大統領はソ連のフルシチョフ書記長に、「キューバからミサイルを撤退しなければ、核攻撃も辞さない」との先制攻撃発言を行ないました。このような対抗状況の場合には、先に決断意思を表明することが相手の意志決定を支配して主動的な地位を確立できます。つまり、「譲歩はない」との“先制パンチ”をくらわすことで、相手側を遅疑逡巡させるのです。

▼「囚人のジレンマ」とは?

スパルタとアテネ(アテナイ)が戦ったペロポネス戦争は「囚人のジレンマ」や「鹿追ゲーム」の典型例です。

「古代ギリシャの歴史家トゥキュディデスによればスパルタとアテナイという当時の二大勢力は戦争へと至ったが、もともとどちらも戦いを望んでいなかったという。しかしどちらも、『相手が攻撃の準備をしているのではないか』と疑っていた」(トム・チヴァース『AIは人間を憎まない』)ようです。

両国には、(1)攻撃的にふるまう、(2)友好的に振る舞う、の2つの選択肢がありました。しかし、こちらが友好的な態度であるにもかかわらず、相手がこちらを「攻撃的な振る舞いをしている」と判断した場合、相手は攻撃的となり、友好的な対応をとっているこちら側が一方的にやられることになります。この場合は、本当は攻撃的ではないにもかかわらず、攻撃的に振る舞うことが最適解になります。

たとえ誰もが紛争を望んでいなくても、双方に信頼が欠け、戦闘力が拮抗していれば、合理的選択肢は相手を攻撃することになるのです。これがペロポネス戦争へと発展しました。

さて、現在の米中関係は「トゥキュディデスの罠」といわれますが、「囚人のジレンマ」のゲーム理論からいっても、米中が「合理的なのは、相手を攻撃する」ことだという結論に達します。

そこで、相手国の意図を誤判断する、「不注意なエスカレーション(inadvertent esc
alation)」を防ぐためには、双方が接触を維持し、意思の疎通を図ることが重要となります。
そして、勢力均衡(バランス・オブ・パワー)の努力を継続することが大切となります。

中国が「核心的利益を断固として擁護する」との発言は、台湾問題をめぐり、米国に対する先制的な意思表示です。「チキンゲーム」の理論に基づいた合理的な行動方針であるわけです。

しかしながら、双方は「戦いたくない」との意思があっても、「囚人のジレンマ」によって双方が戦争状態に向かっているというのが実態かもしれません。

「囚人のジレンマ」を避けるためには、双方の意思疎通と軍縮による勢力均衡なのでしょうが、国内世論もあって「囚人ジレンマ」を回避することは容易ではありません。

ビジネスでも、このような局面があると考えます。その実態は何か、どうするのが最良の状況判断であるかは、彼我の対抗シミュレーションを「ゼロサム理論」「チキンゲーム」だけでなく、「囚人のジレンマ」や「鹿追ゲーム」などの理論を駆使して、相手との駆け引きで優位に立ち、無用な衝突を回避することが重要だと考えます。

(※1)別々の車に乗った2人のプレイヤーが、互いの車に向かって一直線に走行し、衝突を避けて先にハンドルを切ったプレイヤーが「チキン(臆病者)」と称され“屈辱”を味わい、負けとなる。

(※2)2人の囚人が、意思疎通のできない別々の部屋で、取調官から「 (1)あなたが自白して、相手が黙秘したら、あなたを無罪にしよう。ただしその場合、相手は懲役10年になる。(2)あなたが黙秘して、相手が自白したら、あなたは懲役10年になる。ただしその場合、相手は無罪になる。(3)2人とも自白したら、2人とも懲役5年になる。(4)2人とも黙秘したら、2人とも懲役2年になる」との取引きを持ちかけられた。
 その場合、ゲーム全体を見てみると、双方にとってもっとも都合がよい選択肢は、2人がともに黙秘して懲役2年になることである(パレート最適=誰も不利益をこうむることなく、全体の利益が最大化された状態、2人合わせても4年の懲役で済む)。

しかし、囚人の立場になると、自分だけが黙秘をして相手が自白をしたら懲役10年になるわけで、これはリスクが大きいと感じる。それなら「最悪でも5年の懲役」、うまくいけば懲役免除になる方策(行動方針)、つまり、双方ともに自白を選定する方が合理的である。結局のところABともに裏切り、自白して、結果的に協力した時(互いに黙秘)よりも悪い結果を招いてしまうことになる。

(※3)鹿狩りをするにはハンターの協調が必要である。1人だけでは鹿を仕留められない。しかし、なかなか鹿を仕留めるのは難しいので、1人のハンターが収穫0になるよりも、足元の兎を追いかけるというジレンマ。協調して鹿を取るのが合理的であるが、相手に対す
る猜疑心から相手が合理的な判断をしない、あるいは突飛な行動を取るかもしれないと考えて、裏切る(この場合は兎を追いかける)者が出てくる。

(つづく)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA