我々が求めるAIとは、碁を打ち、猫の写真を探すものではない:Over the AI ――AIの向こう側に(2)(7/9 ページ)
ちまたには「人工知能」という言葉が氾濫しています。ですが、明言しましょう。「人工知能」という技術は存在しません。そして、私たちがイメージする通りの「人工知能」の実現も、恐らくはまだまだ先になるでしょう。
読まなくても内容把握? テキストマイニング
では、ここからは後半になります。
前回お約束した通り、後半は、「私の身の回りの出来事」を使った、「数式ゼロ」のAI解説を試みてみたいと思います。
今回は、前半の“人工知能”の解説記事”の分析で使ったテキストマイニングについて説明したいと思います。
「テキスツマイニングは“人工知能”なのかどうか」の判定については、前回の『江端AIドクトリン』に基づき、「江端が『AI』と思ったものであれば、誰がどう反論しようが、それはAIである」で押し通します。
テキストマイニングの効果を、身もフタもなく説明すれば、
「上司から読んでおくように言われた、膨大な資料(机の上に30cm以上も積まれた)を、自分では一行も読まず、全部コンピュータに読ませて、それなりに内容を把握するもの」
でよいと思います。
さらに、テキストマイニングの機能を、これ以上もなく乱暴に説明するのであれば「文章を分解して、登場する単語の数をカウントし、その単語の関係を調べているだけ」と言い切ってもいいです。
「え? それだけ?」と思われるかもしれませんが、これだけのことが、結構侮れないんです。
次に、これらの単語の出現パターンについて統計処理をします(ここまでの処理なら、フリーソフトや、ネット上にも無料の解析サイトがあります(参考)。
では、ここから、本コラムの前半をテキストマイニングで解析した結果を図示していきます。
以下の図は、登場する単語を数え上げたものです。
なお、今回のコラムでは、NTTデータ数理システムのテキストマイニングツール「Text Mining Studio(TMS)」を利用しています。以下は、TMSで、「私が使い倒している機能」を中心に説明致します。
(1)かかり受け頻度解析
単なる単語の頻度だけでなく、単語と単語のかかり受けの頻度情報も調べてくれます。本コラムの前半の内容からは「人工知能ー共存」「絶望ー相転移」「ナンシーー作る」などが発見されます。
Copyright © ITmedia, Inc. All Rights Reserved.