17
FacebookがQLC NANDを要求、東芝がTSV搭載100TB QLC SSDで応える

Facebookはフラッシュメモリサミットの基調講演で、より高密度で安価な100TB QLC NAND SSDを求めました。偶然にも、その1時間後、東芝は100TB QLC SSDの開発という野心的な計画を発表しました。東芝は、64層BiCS3 NANDの新型でQLC(クアッドレベルセル)技術の先駆的な導入を計画していますが、ダイスタッキング能力を向上させるTSV(シリコン貫通ビア)技術も採用し、パッケージあたりの容量を実質的に2倍にする予定です。QLC NANDは、特に耐久性とパフォーマンスの面でいくつかのトレードオフがありますが、最新の最高性能SSDよりも高い密度を提供します。

もちろん、私たちマニアにとって真の疑問は、PCに大容量のQLC SSDが搭載される日が来るかどうかです。では、その技術を詳しく見て、QLC SSDが一般ユーザーにも利用可能かどうか計算してみましょう(ヒント:可能です)。

最初のステップ:NANDダイを積み重ねる

NANDベンダーは、SSD内部でよく見られるNANDパッケージ内に複数のダイを積み重ねています。メーカーはNANDダイをワイヤボンディングで接続しますが、細いワイヤは繊細なため、多数のダイを積み重ねるのは容易ではなく、NANDパッケージが破損する可能性もあります。

画像

1

2

上の写真は、典型的なワイヤベースのダイスタックを2つの角度から示しています。ほとんどのベンダーは、損傷の可能性を最小限に抑えるため、ダイを8個までしかスタックしませんが、プレミアム製品ではまれに16個のダイスタックを使用することもあります。しかし、16個のダイをスタックすると、ワイヤが長くなることでインピーダンスが増加するため、パフォーマンスが低下します。信号整合性が低下するため、ベンダーはフラッシュのクロック速度を落とさざるを得なくなります。サムスンは最近、この問題に対処するために48層NANDに小型のFチップを追加しましたが、これによりデバイスに別のコンポーネントが追加され、複雑さとコストが増加します。

画像

1

3

東芝はこの問題を回避するため、NAND向けにTSV技術を開発しました(HMBで使用されている技術に類似しています)。TSVは、ダイ中央の垂直方向の電気接続を介してダイを接続します。チャネルは、基板上に配置されたインターポーザー上のマイクロバンプと接続されます。この技術により、パフォーマンスを低下させる副作用が排除されます。

また、ダイの積層リスクを低減し、ワイヤボンディングで使用されるオフセット技術とは異なり、ベンダーはダイを垂直方向に完全に積層できるとされています。TSVはインピーダンスを低減し、東芝は電力制限のある環境において、シーケンシャルリード/ライトのスループットをそれぞれ1.7倍/3.1倍向上させると説明しています。残念ながら、TSVはワイヤボンディングよりも製造コストが高くなる傾向があります。

TSVは、高速データ転送時のNANDコアおよびI/Oの消費電力を45%削減します。これは、デバイスレベルでの中程度の読み取り/書き込みアクティビティにおける30/40%の改善に相当します。消費電力の削減は、NANDが発する熱量も削減するという波及効果をもたらし、熱制約の厳しい環境(M.2 SSDなど)に適しています。また、ファブではダイ間にサーマルマイクロバンプを採用することで放熱性を向上させています。FMS 2015では、サードパーティSSDベンダーであるPMC-SierraブースでTSV NANDの実演デモを実際にご覧いただきました。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

おそらく最も重要なのは、TSVによってスタックの高さを前代未聞の32ダイまで増やすことが可能になり、密度が向上することです。東芝の64層BiCS3 NANDはダイ1個あたり32GB(256ギガビット)の容量を誇り、32個のダイをスタックすることで、1つのNANDパッケージで512GBの容量を実現します。同社はまた、次世代のBiCS4 NAND(2017年発売予定)が64GB(512ギガビット)の容量になると発表しました。TSVとBiCS4を組み合わせることで、1つのパッケージで最大1TBの容量を実現できます。

第二段階:ビットを追加する

SLC NANDはセルあたり1ビットを記憶し、2つの電圧状態を表します。一方、MLCはセルあたり2ビットを記憶し、4つの電圧状態を表します。3D NANDの中で最も普及しているTLC NANDは、セルあたり3ビットを記憶し、8つの電圧状態を表します。

画像

1

4

QLC NANDは、16の電圧状態でセルあたり4ビットを記憶します。これは平面型NANDでは不可能なことです。平面型NANDのリソグラフィは、各セルが約12個の電子を保持できるレベルまで微細化しており、セルの摩耗が早くなります。幸いなことに、3D NANDはリソグラフィが緩和(3nm)されているため、セルは16の電圧状態のプログラミングと消去に伴うストレスの増加にも十分耐えられます。3D NANDの利点があるとはいえ、ストレスの増加は耐久性の低下につながります。東芝は、電圧状態の密度増加を概説したスライドを提供しました。

電圧は時間の経過とともに変動する傾向があり、これが読み取りエラーの原因となります。高度なLDPCアルゴリズムはTLC NANDのビットエラー率を改善し、耐久性を向上させますが、QLC NANDではエラー訂正のオーバーヘッドの増加に対応するために強力なASICが必要になります。興味深いことに、東芝は独自のQSBC(Quadruple Swing-By Code)エラー訂正アルゴリズムを開発しており、これは標準的なLDPCよりも強力と言われています。

東芝は、提案しているQLC NANDのP/E(プログラム/消去)比を明示していませんが、同社が提案しているSSDをFacebookの基調講演で発表されたデータ(後述)と比較すると、150サイクル程度と推測できます。これは、通常のSSDと比較して耐久性が指数関数的に低下することを意味します。ほとんどのNANDベンダーは自社のNANDのP/Eサイクル定格を公開していませんが、平面型MLC/TLCはそれぞれ約3,000/1,000サイクルを吸収できると広く考えられています。ただし、これは採用されているエラー訂正の種類によって異なります。

QLC SSDの外観

東芝はQLC NANDベースのSSDを開発中であることを示して、仕様を記載したスライドを提示した。 

最大100TBのフラッシュメモリを搭載可能なQLC SSDは、HDDのSATAインターフェースではなくPCIe 3.0インターフェースを採用しています。より広いデータレーンにより、QLC SSDは最大3/1GBpsのシーケンシャルリード/ライトスループットと、50,000/10,000のランダムリード/ライトIOPSを実現します。PCIe SSDとしては、ランダムライトの仕様はそれほど驚異的ではありません。QLC NANDは、アーカイブデータやコールドデータなど、アクセス頻度の低いWORM(Write Once Read Many)データの保存にのみ使用されるため、ランダムライトパフォーマンスはそれほど問題になりません。

消費電力の削減

100TBのSSDは、大容量データの保存に必要なスペースを削減します。これは通常、低容量のHDDで対応しなければならない作業です。8TBの大容量HDDでも、QLC SSD 1台と同じ容量のストレージを提供するには12台のドライブが必要です。QLC SSDは消費電力を9Wと抑え、さらに重要なのは、アイドル時の消費電力が100mWで、復帰時間(ウェイクアップ時間)が5msであることです。HDD単体の動作時の消費電力はQLC SSDと同程度ですが、そのパフォーマンスは比較になりません。また、HDDはアイドル時にも8Wの電力を消費し、同様の復帰時間を実現します。HDDはアイドル時の消費電力は低いですが、消費電力を抑える代わりに復帰時間を犠牲にしています。

さらに状況が不均衡になるのは、ほとんどのデータセンターがHDDをRAIDアレイで運用しているためです。そのため、ドライブ1台のアイドル時の消費電力はアレイ内のドライブ数倍に増加します(HDDは96W、QLC SSDは0.1W)。アイドル時の消費電力が低いことは、WORMデータにとって重要です。コールドデータストレージデバイスはほとんどの時間をアイドル状態で過ごすためです。HDDは到底太刀打ちできません。アレイへのデータの書き込みや取得には通常、すべてのドライブをスピンアップさせる必要があり、その結果、アクティブ時の消費電力が大幅に増加します。

持久力に関する懸念

QLC SSDの3~6PBという耐久性は一見すると印象的ですが、他のエンタープライズSSDとの比較データを比較することで、耐久性が大幅に低下していることが明らかになりました。SSDの耐久性は、使用されているフラッシュメモリの種類、SSDのオーバープロビジョニング量、エラー訂正能力など、複雑な要因の組み合わせによって左右されます。東芝QLC SSDの具体的な測定値は入手できていませんが、東芝から提供された基本データを使用して概算値を算出できます。

スワイプして水平にスクロールします

ヘッダーセル - 列 0東芝QLC SSDサムスン PM963インテル DC P3500インテル DC P3600インテル DC P3700マイクロン9100マイクロン 9100 MAX
ナンド東芝QLC48層3D TLC NAND20nm MLC20nm MLC20nm MLC16nm MLC16nm MLC
最大容量100TB3.84 TB2TB2TB2TB3.2 TB2.4
持久力3000~600054661095109506205032806570
アドレス可能容量 1 TB あたりの耐久性 (生涯)30~60歳1,4235475,47531,0251,0252,738
DWPD0.027 ~ 0.054 DWPD (推定 3 年)1.3(3年)0.3(5年)3 DWPD(5年)17 DWPD(5年)0.56(3年)2.5(3年)

IntelのDC SSDファミリーをリストに加えたのは、低耐久性製品から高耐久性製品までを網羅しているからです。QLC SSDは、3年間の保証期間(未確認)を想定すると、DWPD(Drive Writes Per Day:1日あたりのドライブ書き込み回数)の耐久性が0.027~0.054となります。一方、高耐久性SSDは最大17 DWPDを実現します。「通常の」低耐久性SSDでも0.3 DWPDです。

耐久性データを見る別の方法は、グラフに示されているように、ユーザーが書き込み可能な容量1TBあたり、ユーザーが書き込み可能なデータ容量TB数を計算することです。QLC SSDが他のSSDに大きく遅れをとっていることは明らかです。QLCのTBあたりの耐久性は非常に低いため、エンタープライズアプリケーションの小容量SSDには適していません。

QLC SSD をデスクトップで使用できますか? もちろん、なぜダメなのか。

コンシューマー向けSSDは様々な形状とサイズがあり、耐久性も様々です。業界では、耐久性の低い3D TLC NAND SSDがトレンドとなっています。これは、ほとんどのユーザーにとって十分すぎるほどのパフォーマンスと耐久性を提供し、価格もそれに見合った適正価格であるためです。

スワイプして水平にスクロールします

ヘッダーセル - 列 0東芝QLC SSDサムスン 2TB 850 EVO
ナンド東芝QLC48層3D TLC NAND
容量2 TB(推定)2TB
持久力60~120150

Samsung 850 EVOは、歴代SSDの中で最も販売台数が多いため、2TBバージョンを基準モデルとして比較するのは理にかなっています。市場にはより高速で耐久性の高いSSDも存在しますが、850 EVOはほとんどの用途に最適な組み合わせを実現しています。 

2TB 850 EVOは150TBWの書き込み性能を備えており、5年間の製品寿命で150TBの書き込みを吸収できます。理論上の2TB QLC SSDも、最大で約120TBW(アドレス可能容量1TBあたりの耐久性計算から算出)と、ほぼ同等の耐久性を備えています。この耐久性はほとんどのデスクトップユーザーにとって十分な性能であり、より大容量のQLC SSD(4TBや8TBモデルなど)を構築することで、耐久性はさらに向上します。

例えば、6TBのQLC SSDは最大360TBWの耐久性を備えています。QLCの成功の鍵は大容量化であり、それより小さい容量では耐久性の基準を満たせません。最低60TBWという数値は少し物足りないかもしれませんが、SSDメーカーはオーバープロビジョニングによって耐久性を向上させることができます。850 EVOの耐久性の閾値は比較的低いですが、今のところ問題は発生していません。QLC SSDは実用に耐えうるほどの性能を備えていると言えるでしょう。

850 EVOは理論上のQLC SSDに対して大きなパフォーマンス優位性を持っていますが、オーバープロビジョニングを追加することでこの問題の大部分を解決できます。850 EVOの卓越したパフォーマンスはバリューセグメントでは稀有な存在であり(だからこそ人気が高いのです)、他のSSDベンダーは既に低コストのDRAMレスSSDや「HDD代替品」への移行を進めており、QLC SSDがパフォーマンス面でこれに匹敵するのは難しくないでしょう。

Facebookが再びWORM SSDを呼びかけ

東芝にはすでに熱心な顧客が1社いるようです。3年前のフラッシュメモリサミットで、Facebookは業界に対し、WORMアプリケーション向けの安価なフラッシュメモリの開発を要請したことは有名です。3年かかりましたが、東芝はFacebookの願いを叶えたようです。

画像

1

4

Facebookと東芝は提携関係にあることを認めていませんが、Facebookは偶然にも100TBのQLC SSDの実験を既に行っていると言及しました(SSDのグラフィックも掲載されていました)。また、目標は150 P/Eサイクルだとも述べています。東芝はQLC SSDを初期段階のフィールド導入段階にあると報じられており、Facebookが主要顧客の一社であることは容易に推測できます。

Facebookは、それぞれのソリューションの速度に基づいてインフラストラクチャを複数のストレージ層に分割し、業界で最も積極的に技術を早期に採用してきたという評判にふさわしく、最高速層には既に3D XPointを採用しています。Facebookは業界に新技術の開発を要求することに慣れており、Open Compute Project(OCP)に見られるように、時にはそれを強制することさえあります。現時点では、同社はM.2 SSDの普及、NVMeの普及拡大、次世代不揮発性メモリ(3D XPointなど)、そしてQLCの普及を求めています。講演者はまた、業界がQLCの山を登った後には、セルあたり5ビットのNANDが登場することを期待していると述べました。

QLCエコシステムの拡大

東芝はQLC NANDの開発に熱心に取り組んでおり、ファウンドリパートナーであるWD/SanDiskも最終的には同じベースマテリアルを採用することになる(ただし、独自のQLCベース製品は提供する)。WDは既に、Active ArchiveやInfiniFlashプラットフォームなど、QLC SSDの恩恵を受けられるシステムレベル製品をいくつか展開している。MicronはFlash Memory Summitの基調講演でQLC NANDの開発に取り組んでいることを明らかにしたが、IMFTアライアンスがやや分裂しているため、Intelがこの技術を利用できるかどうかは不透明だ。

展示会場でサムスン幹部にインタビューを行いましたが、同社は3D TLC NANDこそが解決策であると強く主張し、QLC NANDは現時点で製品化していないと述べました。SSD市場で圧倒的なリードを持つサムスンの決断に疑問を呈することは困難です。

唯一残る製造拠点であるSK hynixは、QLCに関しては沈黙を守っている。

複数のNANDベンダーは、64層3D NANDを超えることに伴う設備投資と研究開発費の増加により、各ノードの開発サイクルが長期化する可能性が高いと示唆しています。Intelの新しい「ティック・トック・トック」方式と同様に、各社は余剰時間をアーキテクチャの改良に充てると予想しており、これがQLC実現の鍵となる可能性があります。サードパーティ製SSDエコシステムもQLCを活用した未来への道を切り開いています。複数のコントローラーベンダーは、エンタープライズ向けとコンシューマー向けの両方のアプリケーション向けに、QLC対応ASICを開発中であると発表しています。 

QLCの時代はもうすぐ到来

業界がSLC NANDからMLC NANDに移行した際の抵抗を覚えています。当時、私の友人(尊敬するSSDエンジニア)は、MLCはデータセンターでの使用には不向きだと強く主張していました(私はそれが面白くて仕方ありませんでした)。TLC NANDへの移行時にも同様の反発があり、QLC NANDへの移行時にはさらに大きな抵抗が起こる可能性が高いでしょう。

しかし、コストメリットは無視できないほど大きく、QLC NANDの採用は避けられません。主要ベンダー各社がようやく新しい3D NAND製造工場を稼働させ始めており、高品質で安価なNANDが市場に溢れかえるでしょう。QLC NANDが加われば、ニアラインHDDがアーカイブ用途から姿を消すほどの容量増強が期待でき、ストレージ市場を一変させるでしょう。

私たちにとってさらに重要なのは、QLC SSDがデスクトップPCに登場し、そしておそらく登場するだろうということです。SSDベンダーは通常、コンシューマー市場においてスケールメリットを実現し、コスト削減を実現しています。一般ユーザー向けのQLC SSDは、東芝の戦略の重要な部分となる可能性があります。このSSDはおそらく非常に大容量の製品のみになるでしょうが、大幅な値下げが確実に行われ、HDDの終焉を決定づけるかもしれません。

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。