AzureでAIチップにアクセス可能、機械学習を高速化:英Graphcoreのアクセラレーター
Microsoftは、同社のクラウドプラットフォーム「Azure」の顧客に対し、英国の新興企業GraphcoreのAIアクセラレーターチップ「Colossus Intelligence Processing Unit(IPU)」の利用提供を開始した。
Microsoftは、同社のクラウドプラットフォーム「Azure」の顧客に対し、英国の新興企業GraphcoreのAI(人工知能)アクセラレーターチップ「Colossus Intelligence Processing Unit(IPU)」の利用提供を開始した。
大手クラウドサービスプロバイダーが、新興企業のAIアクセラレーターチップでデータを処理する機会を顧客に提供したのはこれが初めてで、数あるAIチップスタートアップの中から選ばれたことでGraphcoreは大きなチャンスを手にしたと言える。
MicrosoftとGraphcoreは2年間、Graphcore IPU向けのクラウドシステムの開発と、Graphcore IPUの視覚処理および自然言語処理(NLP:Natural Language Processing)モデルの強化に共同で取り組んできた。NLPモデルの中でも、Googleの「BERT(Bidirectional Encoder Representations from Transformers)」は、Googleを含む検索エンジンで広く採用されている技術だ。
Graphcore IPUプロセッサカード(それぞれに1組のColossusアクセラレーターが搭載されている)を8枚使うと、BERTを56時間でトレーニングできるという。これは、機械学習ライブラリ「PyTorch」でGPUを使用する場合と同等レベルで、「TensorFlow」でGPUを使う場合よりも高速だという。Graphcoreは、「BERTの推論スループットが3倍になり、レイテンシ(待機時間)が20%向上する」と述べている。
Graphcoreに対する、過剰ともいえるほどの期待値の大きさを考えると(同社の評価額は17億米ドルである)、この性能向上はかなり控えめに発表されているように思える。公表されている性能向上が、Colossus IPU向けにモデルを最適化したいと顧客に思わせるほどの魅力があるかどうかはまだ分からない。
Graphcoreは、さらに大きな性能向上を実現する高性能モデルも発表している。
画像処理モデル「ResNext」の推論スループットは、消費電力が同等のGPUソリューションと比べて3.4倍で、レイテンシは18分の1だという。ResNextは、グループ化畳み込み(grouped convolution)と呼ばれる技術を使用して、畳み込みフィルターをより小さな分離可能なブロックに分割し、パラメータ数を削減しながら精度を高めている。Graphcoreは、「この手法は、チップの大規模並列プロセッサアーキテクチャと柔軟で高スループットのメモリによって、データブロックを何千もの完全に独立した処理スレッドにマッピングできることから、IPUに適している」と説明している。
Graphcoreは、金融市場のモデリングに使用される新しい確率的アルゴリズムである「マルコフ連鎖モンテカルロ(MCMC)」ベースのモデルでも高い成果を出している。Graphcoreによると、この種のモデルは、かつては、計算コストが掛かり過ぎるため金融業界では利用できないと考えられていたという。金融業界における、GraphcoreのIPUのアーリーアダプターは、最適化したMCMCモデルをIPUを使って4.5分で学習させることができたという。既存のチップでは2時間かかっていたので、約26倍、高速化を実現できたとする。
【翻訳:滝本麻貴、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- エッジAIこそ日本の“腕の見せどころ”、クラウドとの連携も鍵
今回は、業界で期待が高まっている「エッジコンピューティング」を解説する。AWS(Amazon Web Service)やMicrosoft、半導体ベンダー各社も、このトレンドに注目し、取り組みを加速している。 - 戦いの火ぶたが切られたエッジAI市場
人工知能(AI)は過去2年間で、世界的なメガトレンドへと変化した。機械学習は、消費者や自動車、産業、エレクトロニクス全般など、ほぼ全てに何らかの形で影響をもたらしている。さらに、私たちがまだ、うかがい知れない方法で社会や生活に影響を与えると思われる。 - 10mWでジェスチャー検出、超小型FPGAを使うエッジAI
Lattice Semiconductor(以下、Lattice)は「CEATEC 2019」(2019年10月15〜18日、幕張メッセ)で、エッジ端末において低消費電力で推論する技術のデモを展示した。 - AIはFPGAのスイートスポット、Xilinxがエッジ推論をデモ
Xilinxは、組み込み技術の国際展示会「embedded world 2019」(2019年2月26〜28日、ドイツ・ニュルンベルク)で、自動車や監視カメラなどでの推論、いわゆるエッジデバイスでの推論をイメージしたデモを展示した。 - 「シュタインズ・ゲート」に「BEATLESS」、アニメのAIの実現性を本気で検証する
前回で最終回を迎えた「Over the AI」ですが、番外編として、私がどうしても、どうしても、書きたかったコラムをお届けすることにしました。SFやアニメに登場するAI(人工知能)の実現性です。今回は、「シュタインズ・ゲート」や「BEATLESS」に登場するAIを取り上げ、エンジニアとして、それらの実現性を本気で検証してみました。 - 忖度する人工知能 〜権力にすり寄る計算高い“政治家”
今回取り上げるのは「強化学習」です。実はこの強化学習とは、権力者(あるいは将来、権力者になりそうな者)を“忖度(そんたく)”する能力に長けた、政治家のようなAI技術なのです。