6
NvidiaとKioxiaは2027年に1億IOPSのSSDを目標に掲げる — AIサーバー用ドライブは33倍の性能向上を目指す
Kioxia LC9 123TB SSD。画像は説明のみを目的としています。
(画像提供:Tom's Hardware)

日経新聞の報道によると、キオクシアはNVIDIAと共同で、2027年までにランダムIOPS1億を実現するソリッドステートドライブ(SSD)を開発中だと発表した。同社は今月初めの記者会見で、このSSDを複数枚(合計2億IOPS)直接GPUに接続することで、AI性能を向上させる計画だと報じられている。

キオクシアのSSD事業部最高技術責任者の福田浩一氏は「NVIDIAからの提案や要望に沿って開発を進めていく」と語った。

1億IOPS SSD

1億回のランダム読み取り速度を誇るキオクシアのドライブは、PCIe 7.0インターフェースを使用してピアツーピアモードでGPUに接続すると予想されており、膨大な量のデータに迅速にアクセスして処理する必要があるAIサーバーでの使用に特化して設計される予定です。

今日のハイエンドのソリッド ステート ドライブは、約 300 万の 4K ランダム IOPS を実現できますが、バースト メモリ アクセスに最適化された最新および今後の GPU のパフォーマンス ニーズを満たすには、大幅に高速化し、NAND メディアとの対話方法を変更する必要があります。

今年初め、Silicon MotionのCEO、ウォレス・コウ氏はTom's Hardwareに対し、NVIDIAは既存のドライブの33倍に相当する1億IOPSを実現するSSDの開発に関心を示していると語った。同時期に、キオクシアは2026年後半に、512KランダムリードIOPSが1000万IOPSを超えるXL-Flashベースの「AI SSD」を開発する計画を明らかにした。

AIワークロードは、埋め込み、モデルパラメータ、またはデータベースエントリを取得するために、頻繁で小規模なランダム読み取りに依存しています。このような場合、512バイトブロックは4KBブロックよりも実際の使用パターンをより適切に反映し、低レイテンシを実現します。512バイトブロックで動作するドライブは、4KBブロックの一般的なSSDと同じ帯域幅を実現できない可能性がありますが、従来のSSDのレイテンシを低減するよりも、複数のドライブを使用してシーケンシャル読み取り/書き込み速度をスケールアウトする方が簡単です。

Kioxia が 2027 年に 1 億 IOPS のランダム パフォーマンスを備えたドライブを構築する予定である場合、1,000 万 512K IOPS のランダム パフォーマンスを備えた Kioxia の AI SSD が 2026 年に実現するかどうかはまだわかりません。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

XL-Flash をお使いですか?

興味深いのは、キオクシアが1億IOPSドライブを具体的にどのように構築しようとしているかです。同社が提案するAI SSDは、高耐久性、超低レイテンシ、そしてかなり高いパフォーマンスを備えたSLC NANDメモリであるXL-Flashをベースとしています。キオクシアのXL-Flashデバイスは16プレーン(クライアントPC向けの最新の3D NANDデバイスの3~6プレーンから大幅に増加)を備えており、シーケンシャルパフォーマンスとランダムパフォーマンスが向上しています。キオクシアはXL-Flashの仕様を公開していないため、このメモリタイプのデバイスごとのパフォーマンスを判断することは不可能です。

一方、32 個の NAND ダイ (オーバープロビジョニング用に 7 個割り当て) と PCIe 5.0 x4 インターフェイスを備えた Innogrit Tacoma ベースの 400 GB XL-Flash SSD が 350 万のランダム読み取り IOPS と 50 万のランダム書き込み IOPS を実現することを考慮すると、各ダイは最大 109,375 のランダム読み取り IOPS と 15,625 のランダム書き込み IOPS に貢献すると推定できますが、この計算にはいくつかの注意点があります。

NAND デバイスの負荷全体で完璧な線形スケーリングを想定すると、1 億 512B IOPS の SSD には、そのようなダイが 915 個必要になります (同じレベルのオーバー プロビジョニングを想定)。 Kioxia は現在、32 個の NAND IC を 1 つのパッケージに詰め込む方法を知っているので、915 個の XL-Flash IC (28 パッケージ) をベースにしたドライブを確実に構築できます。 このようなドライブには、少なくとも PCIe 5.0 x16 ホスト インターフェイス (PCIe 7.0 x4 の方が望ましい) を備えた特別なコントローラーが必要になります。 問題は、完璧な線形スケーリングが存在しないことです。 SSD における NAND デバイスの実際のパフォーマンスは、チャネル帯域幅、マルチプレーン制約、コマンド パイプライン/オーバーヘッド、キューの深さ、ファームウェア、およびその他の多くの要因によって制限されます。 したがって、XL-Flash デバイスを搭載した 1 億 512B IOPS SSD の最良のシナリオは、数十個のコントローラーとスイッチを備えたマルチコントローラー モジュールです。このようなソリューションはオールフラッシュアレイでは意味があるかもしれませんが、Kioxia は明確に SSD について語っています。

HBFさん、ようこそ?

512B ブロックの 1 億 IOPS SSD に従来の 3D NAND メモリを使用することは必ずしも実現可能ではなく、一方、商用データ センター グレードの製品にまったく新しいタイプのメディアを使用することはほとんど考えられないことから、Kioxia は代わりに、NAND メモリを従来とは異なる方法で使用する新しいテクノロジに目を向けるかもしれません。

そうした技術の一つとして、おそらく高帯域幅フラッシュ(HBF)が挙げられるでしょう。これは、最大16個のNANDデバイスとロジックダイ(コントローラ?)を単一のスタックに集積し、TSVとマイクロバンプを用いて相互接続するものです。HBF層は実績のあるNANDメモリセルを使用していますが、複数のアレイに構成することで、非常に高い並列処理能力、ひいては高性能を実現します。キオクシアがこのプロジェクトにHBFを採用するのか、それとも似たような技術に固執するのかは不明です。しかし、超高性能SSDの構築に向けたHBFの実験から得られる知見を、同社が活用していくことは間違いないでしょう。

Tom's HardwareをGoogleニュースでフォローするか、お気に入りの情報源として追加して、最新のニュース、分析、レビューをフィードで受信しましょう。「フォロー」ボタンを忘れずにクリックしてください!

アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。