半導体レーザーのカオス現象で強化学習を高速化:1ナノ秒で意思決定(1/2 ページ)
情報通信研究機構(NICT)の成瀬誠主任研究員らによる研究グループは、半導体レーザーから生じるカオス現象を用い、「強化学習」を極めて高速に実現できることを実証した。
無線通信における周波数の割当てなどを瞬時に判断
情報通信研究機構(NICT)の成瀬誠主任研究員、埼玉大学大学院理工学研究科の内田淳史教授、慶應義塾大学大学院政策・メディア研究科の金成主特任准教授らによる研究グループは2017年8月22日、半導体レーザーから生じるカオス(レーザーカオス)を用い、「強化学習」を極めて高速に実現できることを実証したと発表した。
強化学習は、未知の環境で試行錯誤をしながら学習を行う方法である。画像認識などで注目される深層学習(ディープラーニング)と並び、人工知能(AI)を支える機械学習の1つ。応用例としては、多数のスロットマシンが並ぶカジノで、もうけを最大化する問題(多本腕バンディット問題)の解決などに用いられる。実用レベルでは、データセンターにおけるコンピュータ資源の割り当て、アービトレーション処理や、無線通信における周波数の瞬時割当て処理、ロボット制御といった用途で、強化学習の応用が期待されている。
NICTらはこれまで、「自然界の物理現象を直接用いた強化学習」をいち早く提案し、単一光子を用いた方式で実現してきた。今回は、半導体レーザーにおいて生じる、光のカオス現象で得られる乱雑な信号と、独自開発した強化学習方式を組み合わせることで実現した。
このシステムを用い、「当たり確率の未知な2台のスロットマシンから、当たり確率の高い台を選ぶ問題」(2本腕バンディット問題)を、高速に解決することに成功した。実験の結果、情報が入力されてから出力されるまでの時間はわずか1ナノ秒と、極めて高速に意思決定されたことを確認した。
具体的には、半導体レーザーで得られたレーザーカオスを高速にサンプリングし、計測した信号レベルが閾値を上回る場合は「スロットマシン1」を選択する。逆に閾値を下回る場合には、「スロットマシン2」を選択するように意思決定する。「閾値は過去の戦歴に基づいて、上下に変更することが重要」と話す。また、仮想的に生成した高速な擬似乱数(カラーノイズ)を用いた従来方式に比べても、優れた性能を示すことを確認した。
Copyright © ITmedia, Inc. All Rights Reserved.