ここからは、「バージョン空間法」を、占い師の「客への『へつらい』戦略」の事例で説明します。
まず、占い師は、冒頭の江端の悩んでいる内容
「現在の大学に残れるのか、残れなければどの大学を受験すべきか、その場合の学費はどうするのか、地元に戻ることをどう考えるべきか、大学に残り続けるのが良いのか、就職をすべきなのか」
をヒアリングして、江端の関心のある事項を、以下の3次元のバージョン空間として把握することにしました。
(α)他人の意見を参考にしたいのか、そうではないのか
(β)今の研究を続けたいのか、そうではないのか
(γ)進学によって得たいもの(学位)があるのか、そうではないのか
占い師:「あなたは、先生やご両親の意見を聞いて、自分の研究を続けながら、そして卒業資格(学位)を得たいと思っているんですね」
江端:「そうです」
この時点において、最も小さいS空間が点として確定しました。ここから占い師は、現時点においては無限大であるG空間を少しづつ小さくしつつ、空間ゼロのS空間を少しづつ大きくしていく作業に入ります ―― 江端に気付かれないように。
占い師:「先生やご両親のご意見は参考になりますものね。研究を続けるだけであれば、例えば、企業に入って研究所に勤務するということもできますよね」
江端:「それは、ちょっと違うかな、と思います」
さて、ここで江端は、占い師の質問について否定しましたので、これはG空間を小さくすることができます。具体的には、「他人の意見を希望しない」「研究テーマの継続を希望しない」「学位取得を希望する」という概念記述の空間にまで小さくさせることができます。S空間の方は、それを大きくさせる事例ではないので、変化しません。
占い師:「先生やご両親のご意見ご意見を参考にしながら、今やられている研究と別の研究を、他の学校で開始するというのも、考えられそうですね」
江端:「そうですね」
さて、ここで江端は、研究テーマの継続に対する否定的な見解を、否定していません。つまり、江端にとっては、現在やっている研究のテーマの継続性は、問題にしていないことが判明します。つまりS空間における勉学継続のパラメータは、江端の心の中では、配慮されていないことが分かりました。一方、G空間においては、質問の内容に会わない解空間が一気に消滅することになります。
占い師:「それでは、今の研究を継続しないで、さらに進学とか転学もしないで、先生やご両親のお勧めになっていることをされてはいいかがでしょか」
江端:「……」
江端は、この意見に対して、難色を示していますので、G空間の一部の解空間が失われて、さらに小さくなっていきます。
占い師:「ご自分のことですから、やはりご自分で決意された上で、今とは別の研究を、進学または転学して続けられる、ということもありえますね」
江端:「そうですね」
この時点をもって、G空間とS空間が一致し、占い師は、(江端すら気が付いていなかった)江端の内心を解読することに成功しました。
占い師:「では、お告げを伝えます。ご両親や先生の意見を参考にしてもしなくても良いでしょうし、また今の研究を続けても、また研究テーマを変更しても良いでしょう。しかし、1つ確実なことは、あなたは、進学または転学をすべきです!」
という、江端にとっては、「プロセスや環境はどーでもよくて、ただ学位が欲しいだけ」という、なんとも幼稚な希望 ―― 幼稚であるが故に自分自身では認められなかった気持ちへの『へつらい』に、この占い師は成功した訳です。
しかし、率直に言って、こんなやり方、
―― 面倒くさいな
って思いますよね。
普通の占い師であれば(というか、普通の人間であれば)、この様な5つのステップも必要なく、2回程度の質問で、この程度の結論に至れそうです。エキスパートシステムが、当たらなかった理由は、この辺りにあるような気がします。
しかし、そもそもコンピュータの帰納学習は、どうしてもこのような手法(記号化して、論理式に当てはめる)にならざるを得ません。そのようなコンピュータの制約がある中では、「バージョン空間法」は、比較的イケている方法なのです。
例えば、FIND-Sアルゴリズムというものがあります。これは、特殊な仮説から開始し,事例と矛盾しないように,仮説の最小一般化を繰り返し,最大特殊化仮説を導くものですが、バージョン空間法のように、2つの空間のサンドイッチみたいなことができません。
ですから、仮説を特殊化しすぎていたり、一般化しすぎていたりしても、それを検知することができませんし、質問を打ち切るタイミングも分かりません。解答に矛盾があっても、その発見が難しいという問題があります。
とはいえ、やっぱり、このバージョン空間法を、実際のサービスとして適用するのは難しそうです。まず、概念空間を自動的に作り出す手段がありませんし、解空間の広さによっては、質問の回数が、膨大になり、意味のある時間内で終了できないかもしれません(例えば、占いのブースに2年間くらい泊まり込むとか)。
ともあれ、機械学習の中の帰納学習の1つである「バージョン空間法」が、人間の思考アプローチに近いものであること、そして、過去の情報をうまく組み会わせて動いていることの2つをご理解いただけたのであれば、十分です。
Copyright © ITmedia, Inc. All Rights Reserved.