なぜ「京」がスパコン1位を獲得できたのか:プロセッサ/マイコン(2/2 ページ)
SPARCプロセッサを採用したことだけが勝因ではない。インターコネクト性能とプロセッサ性能のバランスが良いことが理由だ。TOP500で最も消費電力が大きなスーパーコンピュータでもあるが、エネルギー効率は4位と優れている。
プロセッサとインターコネクトが共に優れる
京は、独自に開発した富士通の「SPARC64 VIIIfx」プロセッサを大量に搭載した(関連記事「8コア内蔵で128GFLOPSを実現、富士通が新SPARCプロセッサを開発」)。GPUアクセラレータを採用するという新しい流れには逆行する形だ。
チップごとに8コアを内蔵しているため、全部で54万8352個のコアが搭載されていることになる(図2)。TOP500リストにある他のどのスーパーコンピュータと比べても、約2倍多い。TOP500リストに登場するスーパーコンピュータが搭載するコアの平均個数は、2010年6月に1万267個、2010年11月では1万3071個だったが、今回は1万5550個まで増加した。
SPARC64 VIIIfxは、最大動作周波数である2GHz動作時に、128GFLOPSの演算処理性能を実現する。このとき消費電力量は58Wだ。こうした性能を実現する上で重要な鍵となるのが、高性能のクラスタに向けた一連の拡張機能である。この拡張機能を利用すれば、プロセッサが内蔵する6Mバイトの共有L2キャッシュをアプリケーション側から管理できる。SPARC64 VIIIfxは、SIMD(Single Instruction Multiple Data)対応であり、1コア当たり256本の浮動小数点レジスタを備え、コア内部でハードウェアの同期処理を実行することができる。
ドンガラ氏は、この他にも京が成功した要因として、「プロセッサとインターコネクトを同時に設計し、単に組み合わせるのではなく、互いに性能を引き出せるようにうまく適合させた」ことを挙げている。
「Tofu」と呼ばれる京のインターコネクトのトポロジ構造は、6次元のメッシュ/トーラスであり、5Gバイト/秒の転送速度を実現する。外部スイッチは不要だ。上限である10万ノードの接続を構築すると、10PFLOPSの性能を実現できるという。
さらに設計面で優れているのが、ノードがシングルCPUであるという点だ。このため、比較的シンプルなメモリ階層をサポートできる上、より高いメモリ帯域幅を実現することが可能だ。
ドンガラ氏は、「高速なコンピュータシステムを構築するためには、バランスがよく、うまく統合されている必要がある。京は、まさにそれを実現している」と述べている。
次回の首位はIBMかCrayか
京は今回、大差をつけて首位を獲得したものの、新たな挑戦者は既に迫ってきている。ドンガラ氏によれば、首位の座を狙える可能性を秘めたスーパーコンピュータは、IBMの「Blue Waters」とCrayの「XK6」であるという。
Blue Watersは、米University of Illinois, Urbana-Champaignと、同大学にある米国立スーパーコンピュータ応用研究所(NCSA:National Center for Supercomputing Applications)、IBM、Great Lakes Consortium for Petascale Computationが共同で開発した。IBMの「Power 7」プロセッサを最大で30万個搭載している。Power 7は、1つのチップに8コアを集積し、1コア当たり4スレッドの並列処理が可能だ。ドンガラ氏によると、Blue Watersは現在、設計面で遅延が起こっているのだという。
Blue Watersは、インフィニバンド(Infiniband)やIBMの独自設計などから得たアイデアを組み合わせた新型のインターコネクトを採用している。IBMのシングルのハブチップがインターコネクトを実行し、合計1128Gバイト/秒のピーク帯域幅を、各ノードやスーパーノード、汎用入出力タスクなどに振り分ける。
CrayのXK6は、AMDのx86プロセッサとNVIDIAのGPUを搭載したハイブリッド型のスーパーコンピュータだ。カスタム設計のインターコネクトを採用している。
IntelのCPUが8割近くを占める
以下では、今回のTOP500リストに登場するスーパーコンピュータのトレンドを見ていこう。
今回のTOP500リストでは、初めて上位10位にランクインした全てのスーパーコンピュータが、PFLOPS級の性能を達成した。米国が5台をランクインさせて先頭に立ち、日本と中国からそれぞれ2台ずつ、フランスから1台が上位10位に入った。
Intelのプロセッサを採用したシステムは今回、TOP500リストのうち387台(シェア77.4%)に上り、圧倒的な優位を維持した。ただし、前回の2010年11月の時点では398台(79.6%)だったことから、今回はわずかに減少したことになる。Intelの「Westmere」プロセッサの採用台数は、2010年11月には56台にとどまっていたが、今回は大幅に増えて169台で採用されている。
AMDのプロセッサは、2010年11月に57台が採用していた。今回は65台(13.0%)に増え、Intelに続く。IBMのPowerプロセッサは、前回は40台、今回は45台(9.0%)に増え、第3位だ*2)。
*2)3社のプロセッサを合計すると、497台に採用されている。京のSPARCが例外的であることが分かる。
TOP500リストのうち212台のスーパーコンピュータ(42.4%)が、コア数6以上のCPUを採用している。231台(46.2%)が、クアッドコア・プロセッサを採用している。
インターコネクト技術は拮抗
インターコネクト技術では、10Gビットを含むギガビットイーサネットが最も利用されており、233台(前回227台)が採用した。次いで各種インフィニバンド技術が205台(前回214台)だ。しかし、インフィニバンドを採用したシステムの平均PFLOPS性能は23.0PFLOPSと、ギガビットイーサネット採用マシン(11.6PLOOPS)よりも2倍も高い。
TOP500リストに登場したシステムを販売しているのはどの企業だろうか。IBMとHewlett-Packard(HP)の2社のシェアが高い。どちらの性能が優れているとも言い難い。IBMは213台(42.6%)、HPは153台(30.4%)だ。前回はIBMが200台(40%)、HPが158台(31.6%)だった。
地域別では米国が256台(前回は274台)とトップであり、欧州が125台、アジアが103台だ。アジアは前回84台だったので、上昇傾向にある。
国別では中国に勢いがある。今回は62台に上り、2位の位置にある。国別順位は、米国、中国、ドイツ(30台)、英国(27台)、日本(26台)、フランス(25台)、ロシア(12台)だ。
【翻訳:田中留美、編集:EE Times Japan】
Copyright © ITmedia, Inc. All Rights Reserved.