Home 技術解説-新着 POWER9は、AI時代の全方位プロセッサか ~POWER9の革新と達成を見る

POWER9は、AI時代の全方位プロセッサか ~POWER9の革新と達成を見る

by kusui
POWER9は「AI時代のために特別にデザインされた、唯一の激速プロセッサ」と、日本IBMではアピールしている。POWER1の登場(1990年)から27年を経た9世代目のプロセッサの革新と達成をレポートしよう。

 

コア数・スレッド数が同数でも
処理性能が向上

 IBMは、POWERの64ビット化を完成させた1993年以降、ほぼ3年ごとに新しいPOWERを投入してきた。2010年代に入ってからは2012年にPOWER7+、2014年にPOWER8、そして2017年と2018年のPOWER9である(図表1)

 

 プロセッサの進化は、線幅プロセスの細線化やトランジスタ数の増加、アーキテクチャの革新・改良で示される。POWERで言えば、POWER7+の32nmの線幅プロセスは、22nm(POWER8)、14nm(POWER9)へと細線化され、トランジスタ数は21億、42億、80億へと倍々に増加。そして配線層は17層となり、ダイ上のeDRAMのキャッシュ容量は120MBへと増加した。

 ところが、POWER9の「最大コア数」と「コアあたりのスレッド数」は12コアと8スレッドで、POWER8からの変化が見られない。しかしその一方、処理性能はPOWER9がPOWER8を大きく上回っている(図表2)

 

 これについて日本IBMの久野朗氏(システムズ・ハードウェア事業本部サーバー・システム事業部コグニティブ・システム事業開発 IBM i統括部長)は、「プロセッサの線幅を細くしてコア数を増やすのは性能向上の常道ですが、最近のPOWERプロセッサではこれに加えて、クロック数や消費電力が同じでも性能が向上するようデザインの変更をプロセッサの世代ごとに実施しています。POWER9では、これをさらに前進させ、より高い性能を実現しています」と説明する。

 

スケールアウト型と
スケールアップ型

 POWER9で採用したスレッドは、同時マルチスレッディング(SMT)方式の4スレッドと8スレッドの2つのタイプがあり、4スレッドタイプはLinuxのSoEワークロード向き、8スレッドタイプはIBM i、AIXならびにLinuxのSoRワークロード向きである。分岐や繰り返しが比較的少ないHPCやAI向けのプログラムは4スレッドで、多数のクライアントからの要求を受け付け、多様な処理を必要とするアプリケーションは8スレッドで、という用途の違いを前提としたものだ。

 また、メモリの接続方法も2タイプあり、DIMMを直結するスケールアウト型と、バッファード・メモリを経由して大容量のDIMMが接続可能なスケールアップ型がある(図表3)

 

 POWER9サーバーの各モデルの大きな違いは、このスレッドのタイプとメモリの接続方法の違いである。スレッド数が4か8か、メモリの接続タイプがスケールアウト型かスケールアップ型か。そしてこれに、プロセッサの搭載コア数とプロセッサの総数、メモリやディスクのボリュームが加わってモデルが決まってくるのである。

 ちなみに、スケールアウト・サーバーのS914・S922・S924・L922は「SMT8」と「スケールアウト型メモリ」の組み合わせ、エンタープライズ・サーバーのE950・E980は「SMT8」と「スケールアップ型メモリ」の組み合わせ、Linux専用サーバーのLC921・LC922と、HPC・AI向けサーバーのAC922は「SMT4」と「スケールアウト型メモリ」の組み合わせである。

 

接続インターフェースを
大幅に強化・拡充

 次に、内部バスや外部システムとの接続に目を転じてみると、POWER9ではCPUと各種デバイスとの接続インターフェースを大幅に拡充し、大量データと高速処理への対応を前進させている。なかでもPCIe Gen4への対応は業界として初めてで、CPUに48レーンを設置して最大192GB/sの大容量データ転送を実現。さらにNVIDIAのGPUとCPUとを直結させ、通信プロトコルNVLink 2.0の採用により、150GB/sのデータ転送を可能にした(図表4)

 

 AI・HPC向けのPower AC922はこの構成を採用したサーバーで、2個のPOWER9と最大6個のNVDIA GPU(Tesla V100)をNVLink 2.0で接続し、最大43.2TFLOPSの浮動小数点演算を実現している。なお、このAC922を4608台接続したシステムが、世界最速のスーパーコンピュータ「Summit」である。

 このほか、CPUと周辺機器との間で高速のデータ転送を実現するCAPI 2.0を採用し、さらに25Gb/sのデータ転送が可能なリンクを48レーン新設して、ASICやFPGAとの高速接続を可能にした。

 図表5は、AI・HPC分野のデータ/アプリケーションをPOWER9サーバーで処理する際の適用プラットフォームとスピードの例である。

 

 

AI時代向けにデザインされた  
全方位のプロセッサ

 IBMではPOWER9を、「AI時代のために特別にデザインされた、唯一の激速プロセッサ」とアピールしている。確かに、プロセッサ自体の改良や超広帯域接続インターフェースの採用などにより、AIやHPC、クラウド、ディープラーニングに向く強力な機能を備えている。その一方、スケールアップの仕組みや大容量データへの対応などエンタープライズ向け機能も充実させている。POWER9は、「AI時代の全方位プロセッサ」と言って間違いないだろう。

[i Magazine 2018 Autumn(2018年8月)掲載]

related posts