IBMがPCMを用いた推論チップ「Hermes」の性能を公開:コンピュートインメモリも活用(2/2 ページ)
IBMの研究グループは、Nature Electronicsの最新号で、2022年に初めて作られた、重み400万、64コアの推論チップ「Hermes」の設計と動作を公開した。
Hermesに搭載されたコンピュートインメモリ
コンピュートインメモリは、こうした種類のアプリケーションに最適なアナログ技術だといえる。アナログは、それぞれが1ビット以上を示すことができるため、必要なメモリ素子の数を減らせるからだ。Hermesチップでは、4素子のメモリ1個で8ビット以上の重みを保存することができる。
さらに、ロジックを使用して乗算演算を実行する代わりに、メモリ回路内部で電子的に実行するという点がある。重みは、抵抗としてクロスバーアレイに格納される(図2の黄色部分)。
第1層からの信号は、電圧としてクロスバーの列に入力される(図2のオレンジ色部分の入力モジュレーター)。これらは重みによって乗算され、交差する行に沿って伝送され、そこで結合してA-Dコンバーター(ADC)で変換される。
さらに相変化材料は、局部加熱を使用してアモルファス(高抵抗)から結晶(低抵抗)モードに変更することから、このような種類の用途向けとして特に優れている。推論チップでは、重みをそれほど変化させる必要がないため、再度維持するためのエネルギーを必要としないメモリは、消費電力量を改善することができる。
しかし、このような材料にはデメリットもある。最も重要なのはデバイスの不整合で、動作がわずかにずれてしまうのだ。同様のチップでは、チップへのロード後にネットワークを再トレーニングすることによって、この点を克服している。
Hermesチップは、こうした製造後の調整を回避するために、独自構成のADCを採用している。
まず、各行に独自のコンバーターを配置することで(図2を参照)、行列ベクトル積全体を同時に実行でき、レイテンシの低減とスループットの向上を実現することが可能だ。
そして次に、ADCをシステムのキャリブレーションを行うために使用することで、一部の不整合を効果的に除去し、ローカルデジタル処理装置の他の回路で残りの大半に対応する。
Hermesに組み込まれたもう一つの要素として挙げられるのが、対角選択デコーダー(図2の上部)だ。書きたい要素を正確に分離して、プログラミング処理を向上させる。
Hermesのネットワーク実装を担当する研究者Athanasios Vasilopoulos氏によると、今後の展望として、通信ネットワークを拡張してより多くのデジタル装置を搭載することを目指すという(これにより、例えばTransformerモデルをサポートできるようになる)。
また、これを大型チップにも取り入れることで、ネットワークモデル全体を自律的に動作させたり、他のチップと連携してタイル表示できるようにしたりする予定だという。
Vasilopoulos氏は、「Hermesも量産チップにはならないだろう。まだ研究手段の一つであることに変わりはないが、この技術を真の代替技術になり得るところまで成熟させる道が開かれるかもしれない。現在のところ、まだそこには至らない」と述べている。
Hermesの研究用チップは、IBMコミュニティー以外では利用できないが、興味があれば、IBMのニューラルネットワークトレーニング/推論向け「Analog In-Memory Hardware Acceleration Kit(AIHWKit)」を使用して、アプリケーションでの実行方法についてテストシミュレーションを行うことができる。
【翻訳:田中留美、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- IBMの歴史
チーズスライサーや計算機を扱っていたIBMは、コンピュータ/PC市場に参入し、「帝国」と呼ばれるまでに成長した。今でこそ大規模な人員削減を行っている同社だが、コンピュータ業界における軌跡は、“帝国”と呼ばれるにふさわしい。 - 東京大、量子コンピュータの国内設置でIBMと合意
東京大学は2023年4月、127量子ビットのEagleプロセッサを搭載した量子コンピュータ「IBM Quantum System One」を国内に設置することでIBMと合意した。今年中に稼働予定。127量子ビットEagleプロセッサ搭載のIBM Quantum System Onが北米以外で稼働するのは今回が初めてという。 - 433量子ビットのQPUを発表、IBMの最新開発動向
2022年11月に開催された「IBM Quantum Summit」で、IBMは量子コンピューティングの発展/普及に向けた最新の取り組みを紹介した。 - IBM、半導体など向けでNY州に200億ドル投資へ
IBMは2022年10月6日(米国時間)、半導体、メインフレームコンピュータ、量子コンピュータなどの分野で、今後10年間でニューヨーク州ハドソンバレー地域に200億米ドルを投資すると発表した。 - 枚葉式で2度目のチャンスをつかむ、Rapidus小池氏
米国EE Timesは、imecの年次イベントにてRapidus社長の小池淳義氏に単独インタビューを行った。Rapidusは、「枚葉式の処理」により超短TATで製品を顧客に提供することを狙う。これは、小池氏にとっては“2度目のチャンス”になる。さらに、Rapidusの成功をアナリストがどう見ているかも、紹介する。