そこで、今回の前半は、この解説の修正をさせて頂きます。しかし、この連載コラムは、「数式を使わないAI技術」を"売り"としてきたので、そこは頑張ってみます。
上の図は、CNNが、出力結果の誤差を使って、―― 奈落の底(深層)にあるニューロの出力層から、地表の入力層に向けて逆走する、ダイナミックなバックプロパゲーションの驀進(ばくしん)が存在することを示しています(前回の私の主張を100%ひっくり返しています)。
そして、ここで重要なことは、フィルター(W)すらも、逆伝搬学習によって変化し続けるという点にあります。
前回、私は、フィルターを、複数からなる「エロ本のモザイク」というパラダイムで説明しました。
しかし、フィルター自身が変化し続けるのであれば、この「モザイク論」は破綻しますが、それでも私は「深層学習をエロで説明したい」にこだわりたいのです(不要で、意味のないことだと分っていても、です)*)。
*)筆者の江端は「ここで闘わなければ、異色のAIコラムの連載担当者の沽券(こけん)にかかわる」と固く信じているのです。
今回、私は「フィルターも逆伝搬学習で変化し続ける」ということを、ローティーンエージャーの男子にありがちな「アイドルのコンサートの写真を、ローアングルからのぞく」とか「グラマー女優の水着の写真を、アッパーアングルからのぞく」とかの行為のトライアルであると把握してみました。
2次元である写真を、3次元的視点を変えて視認してみたところで、未知の情報(いわゆる「谷間」と呼ばれるものとか)を確認することは絶対にできません ―― しかし、ここで前々回の内容を思い出して頂きたいのです。
ニューラルネットワークの価値は、「直感的にイメージできない、高次元の空間を使って(データ等の)分離ができるように矯正できる」でした(関連記事:「不幸な人工知能 〜尊敬と軽蔑の狭間で揺れるニューラルネットワーク」)。
つまり、膨大な数の複数の2次元情報(例:猫の写真)を使って、その意味("猫"である)にまで展開できるニューラルネットとは、低次元の情報を、高次元で再構成することができるものなのです。
このように考えた場合、フィルター(W)ですら、バックプロパゲーションで、変化し続けなければならない ―― という解釈ができることになるのです。
(担当編集者のMさん(女性)が、このフレーズを抹消してしまう*1)ことを覚悟して書いてしまいますが)、つまり、アイドル写真集から「谷間」の情報に到達するために、フィルターは、常に変化し続けなれければならない、という解釈(あるいは詭弁)が可能となるのです*2)。
*1)実際に、一部の表現を抹消しました……(担当M)。
*2)実際には、このような未知の情報に到達することは不可能です。アイドル写真集を購入して、CNNを試みる人が出てきたら、「ウソつき」と指弾されることになりかねませんので、念のため記載しておきます。
この解釈によって、ここに私の「モザイク論」は『ギリギリの所で守り切ることができた』と確信しております。
Copyright © ITmedia, Inc. All Rights Reserved.