57
Nvidiaの新型Titan Vは、シングルチップで110テラフロップスを実現

2017年12月8日午後2時45分(太平洋標準時)更新: スペック表のクレジットを追加しました

Nvidiaは、従来モデルを凌駕するTitanクラスの新型GPUを発表しました。同社はGV100 Volta GPUのパワーをデスクトップクラスのグラフィックカードに搭載しました。まさに科学のためです!

NVIDIAの新しいTitan Vは、単一のグラフィックカードとしては前例のないレベルのコンピューティング性能を提供します。同社によると、Titan Vはディープラーニングのコンピューティングタスクにおいて、Titan Xpの9倍の性能を発揮します。

Titan Vは、今年初めにTesla V100データセンターカードでデビューしたNVIDIAのGV100 GPUを搭載しています。GV100 GPUはTSMCの12nm FFN高性能製造プロセスで製造され、211億個のトランジスタを搭載した815mm²の巨大なダイを誇ります。このチップは、従来のGPUコンピューティングパワーを提供する5,120個のCudaコアと、ディープラーニング向けの640個のTensorコアを搭載しています。CudaコアとTensorコアはいずれも1,200MHzで動作し、最大1,455MHzまでブースト可能です。

Titan Vカードには、3,072ビットのメモリバスで動作し、653GB/秒のメモリ帯域幅を提供する12GBの1.7Gb/秒HMB2メモリも搭載されています。NVIDIAによると、このカードには新たにL1データキャッシュと共有メモリユニットを組み合わせた新しい機能が搭載されており、「パフォーマンスを向上させると同時にプログラミングを簡素化する」とのことです。

Titan V の Volta アーキテクチャは、独立した整数および浮動小数点データ パスも提供しており、これにより GPU は、計算とアドレス指定計算の両方を必要とするワークロードを、以前の GPU アーキテクチャよりも効率的に処理できます。

「Voltaに対する私たちのビジョンは、高性能コンピューティングとAIの限界を押し広げることでした。新しいプロセッサアーキテクチャ、命令、数値フォーマット、メモリアーキテクチャ、そしてプロセッサリンクによって、私たちは新たな境地を切り開きました」と、NVIDIAの創業者兼CEOであるジェンスン・フアンは述べています。「TITAN Vによって、Voltaは世界中の研究者や科学者の手に渡ります。彼らの画期的な発見を見るのが待ちきれません。」

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ソフトウェアが付属

NVIDIAは、Titan Vが科学者や研究者向けであることを強調しました。同社は、Titan Vグラフィックスカードを購入したすべての人に、「NVIDIAが最適化したディープラーニングフレームワーク、サードパーティ製のHPCアプリケーション、NVIDIA HPC可視化ツール、そしてNVIDIA TensorRT推論オプティマイザー」へのアクセスが提供されると述べています。

これはゲーム向けではない

NVIDIAのTitanシリーズグラフィックカードは、ゲーマー向けではありません。NVIDIAのグラフィックハードウェアの高度な計算能力を活用できる科学者向けに設計されています。NVIDIAはTitanを一般消費者向けに直接販売していませんが、資金力のあるゲーマーが最高のGPUを購入するのを妨げるものではありません。

Titan Vでは、ゲーマーはPCに搭載するほどの誘惑に駆られないだろう。このカードは驚異的なTensor演算性能を誇るものの、それがゲームパフォーマンスにどう反映されるのかは不明だ。さらに、NvidiaはTitan VをTitan X、Titan X Pascal、Titan Xpの時のように1,200ドルで販売していない。Titan Vは現在発売中で、Nvidiaのウェブサイトから直接注文できるが、今回はTitanレベルのカードとして高額な価格設定となっている。Titan Vが欲しいなら、なんと2,999ドルという高額を覚悟しなければならない。これはTitan Zと同等の価格帯だが、Titan VにはZのように2つのGPUが搭載されていない。

スペック表クレジット: AnandTech

スワイプして水平にスクロールします

製品タイタンVテスラ V100 (PCIe)テスラ P100 (PCIe)タイタンXP
CUDAコア5,1205,1203,5843,840
テンソルコア640640該当なし該当なし
コアクロック1,200MHz??1,485MHz
ブーストクロック1,455MHz1,370MHz1,300MHz1,582MHz
メモリクロック1.7 Gb/s HBM21.75 Gb/s HBM21.4 Gb/s HBM211.4 Gb/秒 GDDR5X
メモリバス幅3072ビット4096ビット4096ビット384ビット
メモリ帯域幅653 GB/秒900 GB/秒720 GB/秒547 GB/秒
VRAM12GB16ギガバイト16ギガバイト12GB
L2キャッシュ4.5MB6MB4MB3MB
半精度30TFLOPS?28 TFLOPS18.7 TFLOPS0.19 TFLOPS(1/64レート)
単精度15 TFLOPS14 TFLOPS9.3 TFLOPS12.1 TFLOPS
倍精度7.5TFLOPS?7テラフロップス4.7 TFLOPS0.38 TFLOPS
行 12 - セル 0(1/2レート)(1/2レート)(1/2レート)(1/32レート)
テンソルパフォーマンス(ディープラーニング)110 TFLOPS112 TFLOPS該当なし該当なし
グラフィックプロセッサGV100GV100GP100GP102
ダイサイズ815mm2815mm2610mm2471mm2
トランジスタ数211億211億153億12B
TDP250W250W250W250W
フォームファクターPCIePCIePCIePCIe
冷却アクティブ受け身受け身アクティブ
製造工程TSMC 12nm FFNTSMC 12nm FFNTSMC 16nm FinFETTSMC 16nm FinFET
建築ボルタボルタパスカルパスカル
発売日2017年12月7日2017年第3四半期2016年第4四半期2017年4月7日
価格2,999ドル約1万ドル約6,000ドル1,299ドル

ケビン・カルボットはTom's Hardwareの寄稿ライターで、主にVRとARのハードウェアを扱っています。彼は4年以上にわたりTom's Hardwareに寄稿しています。