メディア

官能の人工知能～深層学習を最も分かりやすく説明するパラダイム：Over the AI ―― AIの向こう側に（22）（7/10 ページ）

» 2018年06月04日 11時30分公開

[江端智一，EE Times Japan]

全ての試みで学習に成功

　私のプログラムには、入力層144ノード、中間層6ノード、最終層4ノードという、私の人生では試したことがない巨大なニューラルネットワークが登場します（私は、これまで、3桁もの数のノードを持つニューラルネットワークを試したことがありません。なぜなら、1桁でも失敗の日々だったからです）。

　学習の結果ですが ―― 腰が抜けるほど驚きました。

　100回以上、初期乱数のシードを変えて、シナプス結合値を変化させて試してみたのですが、学習成功率100％ ―― 全ての試みで学習に成功しました。

　『何これ？　入力層のノード144個だよ？　そんなこと、本当にあり得る？』 ―― 信じられませんでした。そして、「なるほど、世界が大騒ぎをするはずだ」と納得したのです。

　これはニューラルネットワークというよりは、画像の前処理技術（画像データを、ニューラルネットワークに食べやすいデータに加工した技術）の勝利と言えましょう。私は今、CNNの開発者に対して、心からの最大級の賛辞を申し上げたいです。

　なぜ、CNNがこのような、劇的な成功に至ることできたのか ―― 私は、ここに「エロ写真のモザイク加工処理のコンセプト」を主張したいのです（開発者はきっと怒るでしょうが）。

　本来、画像フィルターとは、「縦方向」とか「横方向」にスリット状にするなど、恣意的に作るものですが、私のプログラムではフィルターは乱数で適当に作られていました（当初、私は、この理由が分かりませんでした（ソースコードをコピー＆ペーストしていたからです））。

　しかし、「これは、エロ写真のモザイクだ」と気がついた瞬間、CNNの各種のコードの意味が、私の頭の中で一気に氷解したのです^＊）。

＊）「畳み込み」はちょっと説明できませんが、「フィルタリング」と「プーリング」については、十分に解説可能です（このコラムが発禁になるので、具体的な解説は差し控えます））。

　要するに、細部の描写を曖昧にすることで ―― まさに、映倫（映画倫理機構）の狙い通りに ―― 画像を「ぼかす」のです。そして、「私たち」……ではなく、「CNN」が、「細部の情報に心を奪われないように」……ではなくて、「細部の情報を想像（妄想）で補完できるように」データの加工を行う訳です。

　「全体としての画像の概要を開示しつつ、部分の画像に対して、あえて『ぼかす』『隠す』『（見えそうで）見えなくする』という処理を施す」―― これが、人類の、特にティーンエージャの脳の「官能をつかさどる」ニューロンの発生とシナプスの活性化に、どれほど資してきたか、今さら皆さんに説明する必要もないでしょう。