Googleが第2世代TPUを発表、処理性能は180TFLOPS:機械学習向けプロセッサの新版(2/2 ページ)
Googleは、機械学習(マシンラーニング)向けのプロセッサ「TPU(Tensor Processing Unit)」の第2世代を発表した。トレーニングと推論の両方に最適化されたもので、処理性能は180TFLOPSになるという。
内部構造は明らかにせず
Googleは、新しいTPUの内部構造やシステム、性能の詳細は明らかにしていない。だが、公表された同チップの仕様や写真を見ると、興味深い疑問が生じる。
同チップで推論と同様にトレーニングをするには、浮動小数点への移行が必要だった。だが、それによって、第1世代のTPUでは40Wだった消費電力が少なくとも2倍に増加する可能性がある。新TPUは、大型ファンとヒートシンクを搭載して、放熱性を限界まで高めていると考えられる。
性能を倍増するために、Googleは単に、第1世代のTPUに使われていた積和演算ブロックとキャッシュの数を増やしただけかもしれないが、第1世代のチップは既に、IntelのサーバCPUと並ぶ、24Mバイトのキャッシュを搭載している。新TPUには、チップのヒートシンクの下にHBM(High Bandwidth Memory)メモリスタックが搭載されている可能性もある。
Googleのシステム設計には、超高速帯域か重要なオンチップメモリのいずれか、もしくはその両方が必要になる。だが、写真を見ると、DRAMは搭載されていないことが分かる。
同システムがどのようなメモリやI/Oを使用しているかについては不明だが、ボードとラックに何らかの変更があったことは間違いない。
Cloud TPUは、大型のヒートシンクを1基、ミドルサイズを2基、小型を8基搭載し、フラッシュメモリ、インターコネクト、スイッチやその他の非公開の素子の放熱を行っている。下記の写真はTPUポッドである。
Dean氏は、「Googleのさまざまなマシンラーニングモデルは既に、Cloud TPU上で動作している」と述べている。ただし、一部のトレーニングはまだ、GPUで行っているという。同氏は、「ゆくゆくはTPUでより多くのトレーニングを行いたいと考えている」と述べている。
開発者は、GoogleのCloudプラットフォームの新しいアルファプログラムを介して、TPU上でソフトウェアを稼働できるようになる。研究者は、1000基のCloud TPUから成るクラスタ「TensorFlow Research Cloud」に無料でアクセスできるという。ただし、研究成果を公開し、少なくともオープンソースの関連ソフトウェアとしてのリリースを検討することに同意することが求められる。
TensorFlowフレームワークの新版も
Googleは、TensorFlowフレームワークのバージョン1.2も発表した。同フレームワークには、ニューラルネットワークに関する知識が豊富ではないユーザーもマシンラーニングを活用しやすくなるような新API(Application Programming Interface)が搭載されているという。
米スタンフォード大学の教授で、Googleのマシンラーニング部門のチーフサイエンティストであるFei-fei Li氏は、「私は数カ月前にGoogleに入ったが、Googleでは、習熟度に関係なく誰もがAIを活用して革新技術の開発や問題の解決を行うことができる」と述べている。
実際に、スタンフォード大学のデータサイエンスイニシアチブは、マシンラーニングの普及を目標の1つに掲げている。その他の企業や研究機関も、同じ目標に向かって商用サービスの展開を急いでいる。
Microsoft ResearchのリーダーでFPGAを活用したマシンラーニング研究を率いるPeter Lee氏は、「MicrosoftのCEO(最高経営責任者)を務めるSatya Nadella氏に会うといつも、AIツールの普及を急ぐよう叱咤激励される」と話している。
Googleは、今後もハードウェアに依存しないスタンスを取る。ユーザーは、TPUサーバ、x86サーバ、GPUサーバのいずれにおいてもマシンラーニングを実行できるようになるという。Li氏によると、Googleの既存のマシンラーニングサービスでジョブを稼働している企業は数社あり、そのうちの1社が米国のオークションサイトeBayだという。
【翻訳:滝本麻貴、田中留美、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- GoogleからAI用プロセッサ「TPU」が登場
Googleが、人工知能(AI)に向けたアクセラレータチップ「Tensor Processing Unit(TPU)」を独自開発したことを明らかにした。同社が2015年にリリースした、オープンソースのアルゴリズム「TensorFlow」に対応するという。 - Google、「半導体のあらゆる分野で技術革新を」
米国で開催された「ISS(Industry Strategy Symposium)」において、Googleは、半導体業界の経営幹部たちに対し、「あらゆる分野においてイノベーションを加速させてほしい」と懇願した。 - Googleが育った小さな建物は、“シリコンバレーの縮図”へと発展した
人と資金と情報が豊富に集まるシリコンバレーでは、50〜60年という長い時間をかけて、イノベーションを生み出すエコシステムが形成されていった。このエコシステムによって、シリコンバレーからは大成功を収めたスタートアップが幾つも誕生している。シリコンバレーには、このエコシステムを“建物の中で再現”している場所がある。 - ムーアの法則は健在! 10nmに突入したGalaxy搭載プロセッサの変遷
今回はSamsung Electronicsの最新スマートフォン「Galaxy S8+」に搭載されているプロセッサ「Exynos8895」を中心に、Galaxy Sシリーズ搭載プロセッサの進化の変遷を見ていく。そこには、ムーアの法則の健在ぶりが垣間見えた。 - 64層TLCで1024GB容量M.2 SSDを製品化 東芝メモリ
東芝メモリは2017年5月29日、NVM Express(NVMe)SSDの新製品として、64層積層の3ビット/セル(TLC)の3次元(3D)NAND型フラッシュメモリを用い最大容量1024Gバイトを実現した「XG5シリーズ」のサンプル出荷を開始した。 - 目指すはロボット技術立国 ―― 移動体IoTと産業用ドローンへの取り組み
移動体のIoT(モノのインターネット)では無線通信を前提とするため、通信遮断対策や帯域確保などさまざまな課題が生じてきた。ここにエッジコンピューティングを導入し、組込みソフトと無線通信の協調による移動体IoTを実現させる。当初はコネクテッドカーからスタートした移動体IoTであるが、昨今は同様の技術がドローンに展開され始めた。ホビー用途のドローンでも、組込みソフトが機体の姿勢制御などを操る。産業利用のドローンには、さらなる安全性と信頼性が求められる。組込みソフトと無線通信の協調が果たす役割は大きい。