4月に開催されたGTC(NVIDIAのGPUテクノロジーカンファレンス)で、NVIDIAはTesla P100グラフィックスカードを発表しました。当時はNVLinkインターコネクトのみを搭載していましたが、ISC 2016の初日に、NVIDIAはTesla P100のPCI-Expressバージョンを発表しました。
このカードはNVLink P100と同じPascal GPUをベースにしており、16nm FinFET製造プロセスで製造された153億個のトランジスタと、もちろんHBM2メモリを搭載しています。搭載されているGP100は、610平方ミリメートルという巨大なGPUです。
しかし、P100のPCI-Express版は、以前発表されたNVLink版よりも動作が若干遅くなります。PCI-Express環境におけるTDP制限のため、NVIDIAは消費電力を300Wから250Wに引き下げる必要がありました。これは、GPUクロックをブーストクロック1480MHzから1300MHzに下げることで実現しました。
Nvidia によれば、その結果、パフォーマンスは半精度で 18.7 テラフロップス (ディープラーニングの多くはこのレベルで実行されます)、単精度で 9.3 テラフロップス、倍精度で 4.7 テラフロップスとなり、NVLink バリアントよりわずかに低いものの、PCI-Express 経由で他のカードが提供できるパフォーマンスをはるかに上回っています。
したがって、NVLink P100 は大規模なアプリケーション向けであり、PCI-Express バリアントは小規模なワークロード向けのワークステーションで使用することを目的としており、これは依然としてディープラーニングに最適です。
NVlink P100 には 16 GB の HBM2 メモリのみが搭載されていましたが、PCI-Express バリアントには 16 GB の HBM2 メモリが搭載されているか、またはメモリをあまり必要としないアプリケーション向けに、720 GB/秒ではなく 540 GB/秒のメモリ帯域幅を提供する 12 GB バリアントが搭載されています。
システムでのカードの利用は 2016 年第 4 四半期に予定されています。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
Niels Broekhuijsenを@NBroekhuijsenでフォローしてください。 @tomshardware 、 Facebook 、 Google+でフォローしてください。