IBM FlashSystemファミリーは、長年の開発とフラッシュテクノロジーへの10億ドルの投資の成果であり、一般的なオールフラッシュアレイ(AFA)の一般的な設計原則の多くを覆しています。AFAの内部設計は、しばしば厳重に守られた企業秘密となっています。OEMはデータサービスのマーケティングに注力する傾向があり、アーキテクチャ設計の詳細については沈黙を守ります。
IBMは先日、FlashSystem 900の内部コンポーネントについて解説しました。FlashSystem 900は、最大100万/60万のランダム読み取り/書き込みIOPSと、10.5/4.5GBpsのシーケンシャル読み取り/書き込みスループットを実現するスタンドアロンアプライアンスです。FlashSystem 900は、IBM FlashSystem V9000およびA9000 AFAのビルディングブロックとしても機能するため、今回の検証ではIBM FlashSystem製品スタック全体を詳細に検証し、コモディティコンポーネントを使用したシステムとカスタム設計のシステムの違いを検証することができます。
オールフラッシュアレイの進化
フラッシュベースのアプライアンスは数年かけて進化を遂げてきましたが、その始まりは、HDD用に設計された既存のストレージアプライアンスに、コモディティなエンタープライズSSD(標準的な2.5インチSASまたはSATA SSDなど)を組み込むことでした。フラッシュの高速性は、HDDに関連するパフォーマンスのボトルネックの多くを解消しますが、SSDはHDDの代替として使用される際、ボトルネックをアレイ内の別のコンポーネント(RAIDコントローラまたはネットワークインターフェース)に移動させるだけです。
AFAムーブメントの先駆者たちは、データセンターのニーズの進化に伴い、内部コンポーネントの高速化とデータパスの最適化を実現したSSD最適化アプライアンスの開発を開始しましたが、各社は独自の開発路線を歩み始めました。AFAベンダーの大多数は依然として2.5インチSSDを採用しています。2.5インチSSDをベースにした最新のAFAは、十分なパフォーマンスと耐久性を備えていますが、SSD内部の機能はSSDベンダーのファームウェアによって制御されています。
IBM、XtremIO(EMC)、Violinなどのベンダーは、カスタムフラッシュモジュールを搭載した独自のAFAを開発しました。これらの新しい設計により、ベンダーはNAND自体をこれまでにないレベルで制御できるようになり、ストレージ密度、パフォーマンス、耐久性、そしてコスト効率をさらに向上させることができます。
IBM フラッシュシステム 900
2UのFlashSystem 900シャーシは、下図に示すように、12個のホットスワップ可能なMicroLatencyモジュールを搭載しています。また、システムには2つの大型リチウムイオンバッテリーパック(左端)が搭載されており、安全上の問題で電源が失われた場合でも、転送中のすべてのデータを基盤となるフラッシュメモリにフラッシュするのに十分な電力を供給します。これらのバッテリーは、必要に応じてこのプロセスを連続して実行できるだけの電力を供給します。
各MicroLatencyモジュールは、1.2TB、2.9TB、または5.7TBのフラッシュを搭載でき、システムはRAID 5構成でモジュール全体にデータをストライプ化することで、障害発生時のデータ損失を防ぎます。IBMはフラッシュレベルで独自の可変ストライプRAIDを採用し、2次元パリティスキームを構築しています。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
各MicroLatencyモジュールは、Xilinx Kintex-7 FPGAを搭載したデュアルPCB設計を採用しています。各PCBには最大4個のFPGAを搭載できますが、各カードに搭載されるFPGAの数はモジュールの密度によって異なります。例えば、1.2TBモジュールでは、1枚のPCBに1個のFPGAのみが搭載されます。複数のFPGAを搭載したアーキテクチャを採用することで、IBMは定常性能と容量を直線的に拡張することが可能です。
下側のPCBをよく見ると、左側に2つのPCIe 3.0 x2コネクタがあります。これらのコネクタはホストに挿入され、IBM独自のシリアルプロトコルを使用して通信します。このプロトコルは、CPUオーバーヘッドとレイテンシの低減など、NVMeと同じ多くの利点と、パフォーマンスの向上を実現します。この独自プロトコルは、カットスルールーティングを備えたハードウェアアクセラレーションデータパスを採用し、割り込みなどのレイテンシの原因となるプロセスを排除します。
各FPGAはLBA管理タスク用に独自のDRAMを搭載しており、IBMはユーザーデータのキャッシュにもDRAMを使用しています。ほとんどのエンタープライズSSDはユーザーデータをDRAMにキャッシュしませんが、システムレベルの電源喪失保護(バッテリー経由)のアプローチにより、IBMはいくつかの設計上の利点を得ています。個々のSSDは、汎用SSDに見られるような専用コンデンサを必要としないため、より多くのフラッシュメモリを設計に組み込むことができます。コンデンサレス設計は、潜在的な障害点とファームウェアの複雑さを軽減します。
フラッシュ パッケージ間にいくつかのコンデンサが配置されていることに気付きましたが、これらはシステムが複数の NAND パッケージに同時に書き込むときに電圧低下を防ぐために使用されます。
IBMはMicron社と戦略的パートナーシップを結び、カスタマイズが可能で、システムに追加のプログラミングフックを提供するFortisFlash NANDを採用しました。これによりIBMは、NANDの寿命と健全性に基づいて、各ブロックの基本プログラミングを動的に変更することができます。Micron社は、適切なチューニングを行うことで、MLC FortisFlash NANDは最大10,000回の書き込み・消去サイクル(標準定格の3,000サイクルの3倍以上)を実現できると述べています。
ECCにはBCHやLDPCなど、様々な種類があり、それぞれに長所と短所があります。市販の2.5インチSSDを採用するAFAベンダーは、SSDベンダーが提供するECCのみを採用できますが、カスタム設計により、カスタムECCアルゴリズムを柔軟に採用できます。
IBMは独自の「リードワンス」ECCアルゴリズムを開発しました。この実装は、容量を大量に消費しエラー訂正能力が限られているBCHと、エラー訂正プロセス中に過度の書き込み増幅(ひいては耐久性の低下)を引き起こす可能性のあるLDPCの境界線をまたぐものです。IBMは、このカスタム「リードワンス」エラー訂正が両方の長所を兼ね備えていると考えています。
IBMはまた、熱分離技術を採用しています。これは、ホットデータとコールドデータを検出し、それらをプールすることで摩耗を軽減するものです。IBMは各セルの残存耐久性を動的に検出し、アクセス頻度の低い「コールド」データを古いNANDセルに保存することで耐久性を維持し、リードディスターブなどの耐久性を低下させる要因を軽減します。IBMによると、熱分離技術によって耐久性が49%向上し、さらにNANDの健全性に基づく選択的ウェアレベリング機能を追加することで耐久性がさらに57%向上するとのことです。
各2Uシャーシには、フロントパネルからアクセス可能なバッテリーの背後に、ホットスワップ対応の冗長電源(右)が2台搭載されています。システムには、2つの大型キャニスターアセンブリにスロットインする4つのホットスワップ対応ファンモジュールが搭載されています。2つの大型キャニスター(左)にはそれぞれ、ホットスワップ対応インターフェースカード上に、ファイバーチャネル、iSCSI、FCoEの各種オプションに対応したI/Oポートが上部に1列ずつ配置されています。
各キャニスターには、Intel Xeon E5 v2 CPU 2基、64GBのRAM、RAIDコントローラ(XBAR)が搭載されています。また、キャニスターはホットスワップ対応であるため、コンピューティングまたはメモリに障害が発生した場合でもダウンタイムは発生しません。また、I/Oポートからフラッシュへのホップ数が2つを超えないように最適化された設計により、一貫したパフォーマンスとレイテンシが確保されています。
より広範な関連性
IBMは2012年にテキサス・メモリ・システムズを買収し、2013年にはフラッシュ技術開発に10億ドルの追加投資を行いました。これにより、一般的なオールフラッシュアレイを凌駕する優れた機能を備えたカスタマイズされたオールフラッシュアレイを開発することができました。IBMは、FlashSystemファミリーは競合ソリューションと比較して最大9.41%優れた耐久性を備え、7年間の保証付きであると主張しています。
IBMは、システム全体の電源喪失保護のメリットを享受できるカスタムMicroLatencyモジュール設計を通じて、さらなる高密度化を実現しています。さらに、ソフトウェアに起因するレイテンシを排除する独自のカスタムハードウェア駆動型シリアルインターフェースも採用しています。IBMは、カスタムECCやアダプティブNANDアルゴリズムといった、非常にきめ細かなメリットを提供できるようにアーキテクチャを設計し、密度、パフォーマンス、コストの面でお客様に大きなメリットを提供しています。
カスタムオールフラッシュアレイの競争に参戦しているのはIBMだけではありません。EMCは最近、フラッシュベースのアプライアンス製品ラインを発表しました。その中にはカスタムSSD設計を採用したものもあり、同社はすべてのストレージシステムをオールフラッシュに移行中です。Pure StorageもFlashBladeアプライアンスで新たな取り組みを進めていますが、まだ一般提供はされていません。Violin Memoryもカスタム設計を採用していますが、業績の低迷と将来性の低迷により、多くの企業が同社のソリューションの利用を躊躇しています。
IBMは出荷容量ではAFAベンダーのトップクラスですが、売上高ではそうではありません。IBMは、この差は競合他社よりも少ないコストでより多くのフラッシュ容量を提供するカスタム設計の結果であると主張しています。
フラッシュベースのテクノロジーの将来は、よりカスタマイズされ最適化された設計が特徴となることは明らかです。これは、特に業界がフラッシュ対応ソフトウェアの導入を開始した場合、コモディティSSDを採用している多くのシステム(および企業)の終焉につながる可能性が高いでしょう。
ポール・アルコーンはTom's Hardwareの寄稿編集者で、ストレージを担当しています。TwitterとGoogle+でフォローしてください。
@tomshardware 、 Facebook 、 Google+でフォローしてください 。
ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。