今回、これが追試できるかどうか、30年前と同じことを試みてみたのですが、一発で同じ現象が登場してきました ―― 過学習です。
前述した通り、XORは4通りの学習データしかありません。しかし、ニューラルネットワークに期待されていることは、その4点以外の点で妥当な解(補完解)を出すことにあります。
ところが、学習に成功したニューラルネットワークは、学習した4点については、ほぼ完全に学習しているのですが他の点については、ぶっちゃけ、放ったらかし状態です。とても空間を補完しているなどと言えるようなものではありません。
ですから、私は、ニューラルネットワークの補完能力を使うために、学習データを使った補完データをエクセル(当時は"ロータス1-2-3"でしたが)を使用して作って、それをニューラルネットワークの学習に使うという、 ―― 本末転倒もここまでくれば笑えてくる ―― というくらい本末転倒なことをやっていました。
かくして、私のニューラルネットワークに対する不信感は、決定的となりました。
さて、今回のニューラルネットワークについての解説(前半)は、ここまでにしたいと思います。
学生時代、私が、このニューラルネットワークと何度格闘しても失敗し続けていた原因は、私のエンジニアのセンスや能力の欠如にあると信じていました。しかし、今回あらためて調べてみると、当時、世界中でも同じことが起こっていたのです。
―― ところが、誰もその事を言い出さなかった。
もっとも、当時はインターネットという概念すらなかった(電子メールは、大学のコンピュータをつないだシステムでバケツリレーされている(UUCP:Unix to Unix Copyプロトコル)程度のものであった)という事情は配慮しなければならないと思います。
しかし、論文や学会などで、このニューラルネットワークの問題点を、早々に開示することもできたはずです。
世間は、ニューラルネットワークに過剰な期待をして、エンジニアや研究者も膨大な時間と金をこの研究に費しました。わざわざニューラルネットワークを使わなくても良さそうなアプリケーションに、無理やり適用を試みて、その効果を強弁する ―― そんな論文が、世界中で山のように量産されていたように思います(そして、今も)。
特に、その分野の権威と言われている人が、「ニューラルネットワークは、AI技術の最終形だ」とまで言っていたとすれば、それに逆らって、「私はそう思わないのですが……」と主張するのには、相当な勇気が要ると思います。
そんなことを言えば、学会からは爪はじきにされ、会社では研究予算が付かなくなり、研究者としてのキャリアにも大きく傷がつくことになるでしょう。
特に研究予算というのは、未知の新しい研究開発に付与されるのであって、既知の実績のある技術の適用事例なんぞには、特に、企業の研究部門は、絶対に予算を付けてきません ―― 例え、既知の技術を使った方が、素晴らしい効果が認められるとしても、です。
また、世間的からも、嘲笑されるだけです。「せっかくのAIブームに水を差す、いらんことを言う奴だ」と ―― ほっといてくれ。
加えて、当時はバブルの真っ盛りで、日本中にお金が有り余っており(本当)、その使い道として、AI研究開発は都合のよい対象だったのです。
「バックブロパゲーション、ダメダメじゃん」と、あのとき世界のどこかにいる研究者が、一言だけでも言ってくれれば、無機質なコンピュータルームの絶望的な孤独の中で、私がどれだけ救われたかしれません。
Copyright © ITmedia, Inc. All Rights Reserved.