本来、コンピュータの「売り」は大量・超高速計算にあり、その本分は全検索にあります。
しかし、上記のように、将棋や囲碁の解空間は、今の世界中のコンピュータが束になっても、―― 仮に将来、汎用量子コンピュータが誕生したとしても ―― てんで相手にならないほど巨大なのです。
ですので、私たちエンジニアは、コンピュータが「将棋」や「囲碁」に勝つことができても、それは、定石を引用して「たまたま勝つ」とか「素人には勝つ」とか、その辺のレベルを、ウロウロとしているだけで、人類の寿命(あと10万年くらい?) の方が、先に来るだろうと思っていたのです。
ところが、まさか「将棋」や「囲碁」のマスターを、完膚なきまでにたたきつぶすことになろうとは、想像できなかったのです ―― たかだか、この式一つで。
後述しますが、私も、実際にプログラムのコードに落としてみたのですが、この式の部分だけなら、4行しか使っていません。
私がここまで言うのは、「AI脅威論」を唱える人間よりもタチが悪いかもしれませんが ―― このたった「4行」が世界中のコンピュータ全てを集めてもできないことをやり遂げてしまった ―― と、私には思えてしまうのです。
なぜ、こんな単純な強化学習アルゴリズムが、私のパラダイムを破壊するほどのことができたのか、この機会に考えてみました。
私なりに考えた結果、以下の3つのことが言えるのではなかと思っています。
Copyright © ITmedia, Inc. All Rights Reserved.