官能の人工知能 〜深層学習を最も分かりやすく説明するパラダイム:Over the AI ―― AIの向こう側に(22)(7/10 ページ)
深層学習を正しく理解するのは困難を極めます。ですが、あるパラダイムで考えると、大変に分かりやすくなるのです。そのパラダイムとは、これまであらゆるテクノロジーの進化と発展をけん引してきたと言っても過言ではない、最も偉大なるコンテンツ――そう、「エロ」です。【追記あり】
全ての試みで学習に成功
私のプログラムには、入力層144ノード、中間層6ノード、最終層4ノードという、私の人生では試したことがない巨大なニューラルネットワークが登場します(私は、これまで、3桁もの数のノードを持つニューラルネットワークを試したことがありません。なぜなら、1桁でも失敗の日々だったからです)。
学習の結果ですが ―― 腰が抜けるほど驚きました。
100回以上、初期乱数のシードを変えて、シナプス結合値を変化させて試してみたのですが、学習成功率100% ―― 全ての試みで学習に成功しました。
『何これ? 入力層のノード144個だよ? そんなこと、本当にあり得る?』 ―― 信じられませんでした。そして、「なるほど、世界が大騒ぎをするはずだ」と納得したのです。
これはニューラルネットワークというよりは、画像の前処理技術(画像データを、ニューラルネットワークに食べやすいデータに加工した技術)の勝利と言えましょう。私は今、CNNの開発者に対して、心からの最大級の賛辞を申し上げたいです。
なぜ、CNNがこのような、劇的な成功に至ることできたのか ―― 私は、ここに「エロ写真のモザイク加工処理のコンセプト」を主張したいのです(開発者はきっと怒るでしょうが)。
本来、画像フィルターとは、「縦方向」とか「横方向」にスリット状にするなど、恣意的に作るものですが、私のプログラムではフィルターは乱数で適当に作られていました(当初、私は、この理由が分かりませんでした(ソースコードをコピー&ペーストしていたからです))。
しかし、「これは、エロ写真のモザイクだ」と気がついた瞬間、CNNの各種のコードの意味が、私の頭の中で一気に氷解したのです*)。
*)「畳み込み」はちょっと説明できませんが、「フィルタリング」と「プーリング」については、十分に解説可能です(このコラムが発禁になるので、具体的な解説は差し控えます))。
要するに、細部の描写を曖昧にすることで ―― まさに、映倫(映画倫理機構)の狙い通りに ―― 画像を「ぼかす」のです。そして、「私たち」……ではなく、「CNN」が、「細部の情報に心を奪われないように」……ではなくて、「細部の情報を想像(妄想)で補完できるように」データの加工を行う訳です。
「全体としての画像の概要を開示しつつ、部分の画像に対して、あえて『ぼかす』『隠す』『(見えそうで)見えなくする』という処理を施す」―― これが、人類の、特にティーンエージャの脳の「官能をつかさどる」ニューロンの発生とシナプスの活性化に、どれほど資してきたか、今さら皆さんに説明する必要もないでしょう。
ただ、勘違いされては困るのですが、「CNNとは、ニューラルネットワークに、画像に対する官能感知機能が具備したもの」ではありません。間違っても、そのような宣伝をしないようにしてください(一部のプレスが、また変な記事を書きかねないので、念のため)。
私は、「CNNとは、ニューラルネットワークと好結合する、優れた画像のデータ加工の前処理技術を具備している」と申し上げたいのです。
Copyright © ITmedia, Inc. All Rights Reserved.