Nvidiaの新型Titan Vは、シングルチップで110テラフロップスを実現

2017年12月8日午後2時45分（太平洋標準時）更新： スペック表のクレジットを追加しました

Nvidiaは、従来モデルを凌駕するTitanクラスの新型GPUを発表しました。同社はGV100 Volta GPUのパワーをデスクトップクラスのグラフィックカードに搭載しました。まさに科学のためです！

NVIDIAの新しいTitan Vは、単一のグラフィックカードとしては前例のないレベルのコンピューティング性能を提供します。同社によると、Titan Vはディープラーニングのコンピューティングタスクにおいて、Titan Xpの9倍の性能を発揮します。

Titan Vは、今年初めにTesla V100データセンターカードでデビューしたNVIDIAのGV100 GPUを搭載しています。GV100 GPUはTSMCの12nm FFN高性能製造プロセスで製造され、211億個のトランジスタを搭載した815mm²の巨大なダイを誇ります。このチップは、従来のGPUコンピューティングパワーを提供する5,120個のCudaコアと、ディープラーニング向けの640個のTensorコアを搭載しています。CudaコアとTensorコアはいずれも1,200MHzで動作し、最大1,455MHzまでブースト可能です。

Titan Vカードには、3,072ビットのメモリバスで動作し、653GB/秒のメモリ帯域幅を提供する12GBの1.7Gb/秒HMB2メモリも搭載されています。NVIDIAによると、このカードには新たにL1データキャッシュと共有メモリユニットを組み合わせた新しい機能が搭載されており、「パフォーマンスを向上させると同時にプログラミングを簡素化する」とのことです。

Titan V の Volta アーキテクチャは、独立した整数および浮動小数点データパスも提供しており、これにより GPU は、計算とアドレス指定計算の両方を必要とするワークロードを、以前の GPU アーキテクチャよりも効率的に処理できます。

「Voltaに対する私たちのビジョンは、高性能コンピューティングとAIの限界を押し広げることでした。新しいプロセッサアーキテクチャ、命令、数値フォーマット、メモリアーキテクチャ、そしてプロセッサリンクによって、私たちは新たな境地を切り開きました」と、NVIDIAの創業者兼CEOであるジェンスン・フアンは述べています。「TITAN Vによって、Voltaは世界中の研究者や科学者の手に渡ります。彼らの画期的な発見を見るのが待ちきれません。」

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ソフトウェアが付属

NVIDIAは、Titan Vが科学者や研究者向けであることを強調しました。同社は、Titan Vグラフィックスカードを購入したすべての人に、「NVIDIAが最適化したディープラーニングフレームワーク、サードパーティ製のHPCアプリケーション、NVIDIA HPC可視化ツール、そしてNVIDIA TensorRT推論オプティマイザー」へのアクセスが提供されると述べています。

これはゲーム向けではない

NVIDIAのTitanシリーズグラフィックカードは、ゲーマー向けではありません。NVIDIAのグラフィックハードウェアの高度な計算能力を活用できる科学者向けに設計されています。NVIDIAはTitanを一般消費者向けに直接販売していませんが、資金力のあるゲーマーが最高のGPUを購入するのを妨げるものではありません。

Titan Vでは、ゲーマーはPCに搭載するほどの誘惑に駆られないだろう。このカードは驚異的なTensor演算性能を誇るものの、それがゲームパフォーマンスにどう反映されるのかは不明だ。さらに、NvidiaはTitan VをTitan X、Titan X Pascal、Titan Xpの時のように1,200ドルで販売していない。Titan Vは現在発売中で、Nvidiaのウェブサイトから直接注文できるが、今回はTitanレベルのカードとして高額な価格設定となっている。Titan Vが欲しいなら、なんと2,999ドルという高額を覚悟しなければならない。これはTitan Zと同等の価格帯だが、Titan VにはZのように2つのGPUが搭載されていない。

スペック表クレジット: AnandTech

スワイプして水平にスクロールします

製品	タイタンV	テスラ V100 (PCIe)	テスラ P100 (PCIe)	タイタンXP
CUDAコア	5,120	5,120	3,584	3,840
テンソルコア	640	640	該当なし	該当なし
コアクロック	1,200MHz	?	?	1,485MHz
ブーストクロック	1,455MHz	1,370MHz	1,300MHz	1,582MHz
メモリクロック	1.7 Gb/s HBM2	1.75 Gb/s HBM2	1.4 Gb/s HBM2	11.4 Gb/秒 GDDR5X
メモリバス幅	3072ビット	4096ビット	4096ビット	384ビット
メモリ帯域幅	653 GB/秒	900 GB/秒	720 GB/秒	547 GB/秒
VRAM	12GB	16ギガバイト	16ギガバイト	12GB
L2キャッシュ	4.5MB	6MB	4MB	3MB
半精度	30TFLOPS?	28 TFLOPS	18.7 TFLOPS	0.19 TFLOPS（1/64レート）
単精度	15 TFLOPS	14 TFLOPS	9.3 TFLOPS	12.1 TFLOPS
倍精度	7.5TFLOPS?	7テラフロップス	4.7 TFLOPS	0.38 TFLOPS
行 12 - セル 0	（1/2レート）	（1/2レート）	（1/2レート）	（1/32レート）
テンソルパフォーマンス（ディープラーニング）	110 TFLOPS	112 TFLOPS	該当なし	該当なし
グラフィックプロセッサ	GV100	GV100	GP100	GP102
ダイサイズ	815mm2	815mm2	610mm2	471mm2
トランジスタ数	211億	211億	153億	12B
TDP	250W	250W	250W	250W
フォームファクター	PCIe	PCIe	PCIe	PCIe
冷却	アクティブ	受け身	受け身	アクティブ
製造工程	TSMC 12nm FFN	TSMC 12nm FFN	TSMC 16nm FinFET	TSMC 16nm FinFET
建築	ボルタ	ボルタ	パスカル	パスカル
発売日	2017年12月7日	2017年第3四半期	2016年第4四半期	2017年4月7日
価格	2,999ドル	約1万ドル	約6,000ドル	1,299ドル