IBMでは今回のPower11ファミリーで初めて、オフチップのAIアクセラレータ「IBM Spyre(スパイア)」を導入した。これによりPower11ファミリーでは、オンチップのAI推論機能とオフチップのSpyreという2種類のAIアクセラレータを利用できるようになり、「利用目的に合わせたインフラストラクチャでAIの展開が可能になった」と、IBMでは強調している。
IBMによると、Spyreは、特に計算集約型およびAI駆動型のユースケースにおいて強みを発揮する。一方、Power10から搭載してきた各コアの4つのMMA(マトリックス・マス・アクセラレータ、Matrix Math Accelerators)は、詐欺検知、テキスト抽出、文書分析、RAGによるドメイン適応、パターン認識、予測、画像/動画/音声処理などの「従来型AI」に特に適しているという。
「Power11に搭載されたオンチップアクセラレータ(MMA)と比較すると、Spyreは専用のメモリアーキテクチャ、最適化されたデータパス、CPU からの処理オフロード能力により、はるかに高いスループット、並列処理能力、モデル容量を提供する。Spyre は、翻訳、要約、感情分析などの生成AIアプリケーションで使用される大規模なトランスフォーマーモデルに最適」
Spyreは、PCIeカード上に32個のアクセラレータ・コアを搭載して構成されている。そして周囲に128GBのDDR5メモリを配置しているため、IBMでは「さまざまな大規模言語モデル(LLM)を保持できる十分なメモリ容量」と強調している。
ただし、1つのSpyreアダプターでは「ほとんどのユースケースに対して十分なコンピュート容量を提供できない」ため、1つのI/O拡張ドロワーに8台のSpyreアダプターを接続してクラスタ構成にすることができる。このクラスタ構成は、AIアプリケーションからは1つの高性能コンピュートエンジンとして認識される。1TBのメモリと1.6TB/sのメモリ帯域幅の環境が利用可能になる。
この拡張ドロワーは、Power11ファミリーのすべてのサーバーで利用可能。E1180では最大2台の拡張ドロワーが利用できるという。
・IBM Redbooks「IBM Power E1180:Introduction and Overview」
https://www.redbooks.ibm.com/abstracts/sg248587.html
[i Magazine・IS magazine]