陰湿な人工知能 〜「ハズレ」の中から「マシな奴」を選ぶ:Over the AI ―― AIの向こう側に (8)(9/10 ページ)
「せっかく参加したけど、この合コンはハズレだ」――。いえいえ、結論を急がないでください。「イケてない奴」の中から「マシな奴」を選ぶという、大変興味深い人工知能技術があるのです。今回はその技術を、「グルメな彼氏を姉妹で奪い合う」という泥沼な(?)シチュエーションを設定して解説しましょう。
min-max戦略の概要
では、次の図(Step 2)をご覧ください。
さて、<次女>の第3週目の評価値(の合計値)に対して、当然<長女>の第3週目は、この<次女>の評価値合計を、最悪にするように振る舞うはずです。これが、<長女>のmin戦略となります。
具体的には、<次女>が第3週において"18"と"14"を選べる選択肢があるなら、<長女>は、必ず"18"の選択肢を「つぶす」ような選択を行います。
ただし、<長女>が、実際にmin戦略を取るかどうかは分かりません。ここでは<長女>が、クレバーに振る舞うことを想定しているだけで、<長女>が何にも考えてなれば、当然、戦略は<次女>に有利に働きます。
では、次の図(Step 3)をご覧ください。
この<長女>のmin戦略に対して、<次女>はその最小値の中の最大値を選択します。これが<次女>のmax戦略となります(Step 3)。ただし、ここでも<次女>が選択を間違えると、戦略は狂ってきます。
では、次の図(Step 4)をご覧ください。
さらに<長女>はmin戦略を取ると想定します。
さらに、次の図(Step 5)をご覧ください。
ここに、<次女>が、3週目において、最悪でも評価値の合計"14"が確保できる戦略が成立したことになります。もちろん<長女>が選択を誤れば、この14は、15、16、17、18にもなる可能性があります。
<次女>は、この指し手を保持しながら、<長女>が「ポカ」をするのを待てば良いのです。
さて、これを現実の世界で現わしたものが、以下の図になります。
<次女>は3週先まで読みながら、今週のメニューを決めていますので、場当たり戦略の<長女>に負けることは、まず、ありません。仮に<長女>がクレバーな状態を続けていた場合は、勝負の行方は分かりませんが、<長女>が1回でもmin戦略をミスってくれれば、<次女>の勝利は確定的です。
この「min-max戦略」は、「囚人のジレンマ」「吉田屋 vs. 大スキ屋」のケースを、時間軸方向に拡張したものと見ることもできます。
「囚人のジレンマ」「吉田屋 vs. 大スキ屋」では、4つのケースを想定すればよかったのに対して、今回の「グルメな彼氏」のケースでは、3週先のメニューまで、時間方向に引き伸ばし、294万4656ケースを想定し、かつ、min-max戦略を加えている点において異なります。
しかし、いずれのケースにおいても、ゲーム戦略の基本的な考え方「最悪の中の最良を選ぶ」という点では同じです。
さて、ここから「ゲール=シャプレーアルゴリズム」、いわゆる「安定結婚問題」にも及びたかったのですが、残念ですが、(いつも通り)紙面の問題があり、ここで断念します。
※編集注)今回も安定の超ロング原稿でした。
ただ、この「安定結婚問題」のオチは、「私が、『実際の合コンで「ゲール=シャプレーアルゴリズム」なんぞ使えるわけなかろうが!』と叫ぶ」 ―― となるはずでした。
ここから先は、皆さんの自発的な勉強に委ねることに致します。
Copyright © ITmedia, Inc. All Rights Reserved.