AIデータセンターの次なるボトルネック:ネットワーク
AIワークロード、特に大規模な言語モデルのトレーニングや推論は、膨大な量のデータをGPU間で高速かつ効率的に移動させることを要求します。従来のデータセンターではコンピューティング能力がボトルネックでしたが、AI時代においては、ネットワーク、すなわちGPU、スイッチ、ストレージ間の接続が新たなボトルネックとして浮上しています。この課題を解決するために、光インターコネクト、特にCo-Packaged Optics (CPO) が戦略的に重要視されています。
NVIDIAの40億ドル光戦略とCPOへのコミットメント
NVIDIAは、AIデータセンターのネットワーキングにおけるCPOへの移行を加速するため、大規模な戦略的投資を行っています。具体的には、光部品サプライヤーであるCoherentとLumentumにそれぞれ20億ドルずつ株式投資を行い、将来の光学部品供給を確保しています。NVIDIAのCEOであるJensen Huangは、CPOを「ゲームチェンジャー」と位置づけ、同社のQuantum-XおよびSpectrum-X CPOスイッチの初期導入を進めています。この巨額な投資は、AIインフラの構築において光スタック全体が不可欠であることを明確に示しています。
CPOの技術的優位性と産業化の進展
CPOは、従来のプラガブル光トランシーバーや銅線インターコネクトと比較して、以下の点で劇的な優位性を提供します。
- 電力効率の向上: ASICにより近い位置に光学系を配置することで、信号伝送における電力消費を最大5倍削減し、データセンターの運用コストと環境負荷を低減します。BroadcomのTomahawk 6は、プラガブルと比較して3.5倍の電力効率を実現しています。
- 帯域幅の拡大: 高密度な光接続を可能にし、AIワークロードが要求する超高帯域幅のデータ転送を実現します。
- 信号完全性の向上: 電気信号の伝送距離を短縮することで、信号の劣化を防ぎ、高い信頼性を確保します。
CPOの産業化は着実に進展しており、Broadcomは既に第3世代CPO製品であるTomahawk 6を出荷しています。また、Metaとの共同信頼性テストでは3600万時間という長時間の稼働を達成し、CPOの信頼性が実証されています。しかし、短期的には低コストな銅線の利用、信頼性検証の完了、そしてNPO (Near-Packaged Optics) やLPO (Less-Power Optics) のような中間ソリューションの活用が、CPOの普及速度を決定する要因となるでしょう。
元記事: https://io-fund.com/ai-stocks/nvidia-4b-optical-strategy-cpo-ai-data-centers

コメント