31
Nvidia GTC 2018 ハイライト: AI トラック、メガビデオカード、レイトレーシング

GTC 2018 スライドショー

GTC 2018 スライドショー

NVIDIAの年次GPUテクノロジーカンファレンス(GTC)は、デモ、プレゼンテーション、チュートリアル、そしてセッションで溢れかえっていました。予想通り、AIとディープラーニングの話題がショーの大半を占めていました。そして、残念ながら(おそらく発表はないと分かっていたにもかかわらず)、NVIDIAはゲーミング用の新型カードを発表しませんでした。しかし、NVIDIAはTesla GPUを搭載した新しいQuadroプロフェッショナルグラフィックスカードを発表しました。これは同社が「世界最大のGPU」と謳うもので、実際には16基のTesla GV100 GPUを1つの筐体に詰め込んだもので、消費電力は驚異の10kWに達します。

Nvidia の活気ある技術ショーケースを巡りながら、これらすべてとそれ以上の内容を取り上げます。

ジェンセン・フアン氏の基調講演

ジェンセン・フアン氏の基調講演

Nvidia の CEO である Jensen Huang 氏が自由奔放な基調講演で壇上に上がり、「世界最大の GPU」、フォトリアリスティックなリアルタイム レイトレーシングの最新技術、Volta 搭載の Quadro GV100、自律走行とロボット工学における同社の最新の進歩など、いくつかの新製品を発表しました。

フアン氏の基調講演は、Uberの自動運転車が歩行者と衝突する死亡事故を起こしたわずか数日後に行われた。Uberが事故の詳細を解明する中、この事故は業界全体に衝撃を与えている。フアン氏は、自動運転車の安全性に対する同社のアプローチについて語る中で、厳粛な雰囲気を漂わせた。最高レベルの安全性を確保するために、自動運転プラットフォームは冗長性と多様性の両方を考慮して設計されていると説明した。フアン氏はその後、Uberの車両はNVIDIAのDRIVEテクノロジーを採用していないにもかかわらず、同社は自動運転プログラムの一部を一時停止していることを明らかにした。

Nvidia、「世界最大のGPU」を発表

Nvidiaが発表

NVIDIAの新型DGX-2サーバーは、Huang氏が「世界最大のGPU」と謳うほど、16基のTesla V100を搭載し、合計512GBのHBM2メモリを搭載しています。NVIDIAの新型NVSwitchインターコネクトファブリックは、これら全てを統合メモリ空間を持つ一体型ユニットに統合します。DGX-2サーバーは、2基のIntel Xeon Platinum CPU、1.5TBのメモリ、最大60TBのNVMeストレージを、重量350ポンド(約150kg)の筐体に凝縮しています。

このシステムは10kWの電力を消費し、前世代のDGX-1の2倍の性能を提供します。16個のNVSwitchはGPU間で最大2.4TB/秒のスループットを提供し、システムの処理能力は最大2ペタフロップス(Tensorコア経由)に達します。外部接続は、最大1,600Gb/秒の帯域幅を提供する8つのEDR InfiniBandまたは8つの100GbE NICで提供されます。

Nvidiaは、この強力なDGX-2は15ラックを占有するIntelサーバー300台分の性能を代替できると主張しています。さらに重要なのは、このシステムは300台のサーバーに比べて18倍の電力効率を誇るということです。実に大胆な主張です。Nvidiaの主張を検証するためにDGX-2を購入することも可能ですが、40万ドルかかります。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

テスラV100のブースト

テスラV100のブースト

Tesla V100は驚異的なパワーを秘めています。815mm² ダイはフルレチクルサイズで、210億個のトランジスタを集積しています。ここでは、DGX-2システムに搭載されているNVIDIAの新しいSXM3パッケージの巨大なダイを見ることができます。この最新パッケージは350W(旧モデルより50W増加)で動作し、32GBのHBM2メモリを搭載しています。

NVIDIAは、すべての新型Tesla V100のHBM2メモリを32GBに増量すると発表しました。この増量は即時発効となります。根深いメモリ不足は現在のGPU不足の主要因となっており、Tesla V100のメモリ割り当て増加は不足を悪化させる可能性があります。NVIDIAはまた、異例の措置として16GBモデルの販売を停止するため、すべての新型モデルに増量されたメモリが搭載されることになります。

Dell EMC、HPE、IBMなどの大手OEMメーカーは、強化されたカードを搭載した新システムを第2四半期に発売すると発表しています。データセンターがAI中心のアーキテクチャへの移行を進めるにつれ、これらの製品は売れ行きが好調になると予想されます。

NVSwitches を実行する

NVSwitches を実行する

NVIDIAの新しいNVSwitchは、同社にとって画期的な成果であり、DGX-2サーバーで16基のGPUを統合することを可能にします。このシステムは12基のNVSwitchを搭載し、合計14.4TB/秒の帯域幅を実現します。

NVIDIAはPCIeの帯域幅制限を回避するためにNVLinkファブリックを開発しましたが、GPUあたり6つのNVLinkポートしか利用できないため、拡張性には限界があります。新しいNVSwitchは、スイッチあたり18個の8ビットリンクでこれらの制限を回避し、各GPU間で合計300GB/秒の帯域幅を実現します。これは標準的なPCIe 3.0接続の10倍の速度です。Huang氏は、これをDGX-2の上部トレイと下部トレイに200枚のNICを接続するのと同等だと説明しました。

これらのスイッチは、TSMCの12nm FinFETプロセスで製造された20億個のトランジスタを搭載しています。このファブリックはメモリセマンティクスを採用することで、既存のGPUプログラミングモデルを阻害することを防ぎます。このファブリックはノンブロッキングクロスバーであるため、アクティブにデータを送信しているGPUの数に関係なく、各GPUに300GB/秒の帯域幅をフルに提供し、より大規模なAIモデルを可能にする統合メモリ空間を提供します。すべてのスイッチおよびファブリックトポロジーと同様に、インターコネクトを通過する際にレイテンシのペナルティが発生しますが、NVIDIAはまだ詳細を明らかにしていません。

私に任せてください

私に任せてください

Nvidia の新しい Isaac SDK は、メーカーが認識、ナビゲーション、操作に AI を活用する次世代ロボットを開発できるように設計されたライブラリ、ドライバー、API、その他のツールのスイートです。 

NVIDIAのデモでは、ABB社の7DoFロボットがキャビネットの引き出しをリアルタイムで開閉する様子が披露されました。このシステムは、Xbox Kinectのシンプルなセンサーを用いて周囲の環境を検知し、AIが次世代ロボットの部品コスト削減にどのように貢献できるかを示唆しています。NVIDIAはまた、開発者が新しいロボットをシミュレートされたテスト環境で試運転できるテストスイート「Isaac Sim」も発表しました。これにより、人間は高額な事故やロボットの暴動といったリスクから守られることになります。

倉庫の革命

倉庫の革命

GeForce GTX 1060は一体どこへ行ってしまったのかと疑問に思っている方、その答えがあります。Kinema Systemsは、パレットから様々なアイテムを検知して荷降ろしする様子を実演するために、大型ロボットを展示会場に持ち込みました。このロボットも、あの人気のグラフィックカードを搭載しています。

マルチSKUピッキングは、ランダムに梱包されたパレットから、様々なサイズや重量の荷物を仕分けして移動させる作業です。従来、ロボットは異なる箱の違いを感知できなかったため、この種の作業をロボットに学習させることはほぼ不可能でした。

AIがそれを変えます。Kinemaはディープラーニングモデルをトレーニングし、箱を検出してオンラインで収集した情報に基づいて自動的に識別します。その後、システムはロボットの上空に設置されたビデオカメラを使用し、推論ワークロードを実行してビデオ出力を分析します。これにより、ロボットはランダムに配置された箱のサイズ、形状、重量を検出できます。同社はロボットの駆動にGTX 1060を使用しています。Nvidiaは最近、消費者向けデバイスのEULAを変更し、データセンターでの使用を禁止しました。しかし、産業用途に関する制限は認識していないため、当社のゲーミングカードの多くが、地元のロボット搭載倉庫に送られる可能性があります。

ホロデッキに乗り込もう

ホロデッキに乗り込もう

ジェンセン・フアン氏は昨年のGTC基調講演で、フォトリアリスティックなホロデッキを初公開しました。今年のGTCでは、NVIDIAがこの新技術を一般公開しました。ワーナー・ブラザース製作の映画『レディ・プレイヤー1』が今週、全国の劇場で公開されますが、NVIDIAは「Aech's Basement」のVR版を先行公開しました。これは4人1組のチームが仮想現実空間で様々なパズルを解き、最終的に脱出を目指す脱出ゲームです。NVIDIAはまた、ケーニグセグ・オートモーティブABのRegera Hypercarのデモも一般公開しました。

Quadro GV100 GPU、9,000ドルで入手可能

NVIDIAは今年のGTCで、新型GPU「Quadro GV100」を発表しました。最新のQuadroは、NVIDIAのプロフェッショナル向けグラフィックスカードシリーズにVoltaアーキテクチャを採用しています。GV100は、32GBのHBM2メモリ、5,120基のCUDAコア、そして640基のTensorコアを搭載しています。NVIDIAによると、この高性能カードは倍精度演算で最大7.4テラフロップス、単精度演算で最大14.8テラフロップスを実現。また、ディープラーニング性能(Tensorコアの性能指標)は最大118.5テラフロップスに達するとされています。

同社は、ワークステーションユーザーがRTXテクノロジーを活用できるように計画しています。これにより、リアルタイムレイトレーシングは、メディア制作など、より幅広い用途に活用できるようになります。

GV100 1枚では物足りないという方のために、NVIDIA は新しいカードに NVLink 2 を搭載しました。これにより、2枚のカードを1つのユニットに統合できます(SLI と同様)。ただし、2枚のカードをペアリングするには費用がかかります。1枚の価格は 9,000 ドルです。

まず敷地をマッピングし、それから建設する

まず敷地をマッピングし、それから建設する

いいえ、これはNVIDIAブランドのブルドーザーではありません。AIの先駆者たちは、自動化が最終的に標準的な車両の枠を超え、建設機械を凌駕すると予測しています。しかし、世界中の建設労働者にとって朗報なことに、その未来はまだ遠い地平線上にあるのです。今のところ、Skycatchのような進取的な企業は、NVIDIAのJetson開発キットを使って、インテリジェントドローン(左の写真)で建設現場の地図を作成しています。

ドライブPXペガサス

ドライブPXペガサス

Nvidiaは、強力なDRIVE PX Pegasusモジュールを展示していました。Nvidiaは、最新のレベル5自動運転車に搭載するためにこのスーパーコンピュータを設計しました。このシステムは、デュアルTesla V100とXavier SoCを搭載しています。Pegasusは毎秒320兆回の演算処理を行い、360度カメラとLIDARから送られてくる膨大な量のデータを分析します。

このシステムの消費電力はわずか500Wです。これは、電気自動車の燃費に直結する電力消費量であるため、重要なポイントです。Pegasusは現在開発中です。最終バージョンでは、GV100モジュールの代わりに、NVIDIAの次世代GPU(名称未定)を2つ搭載する予定です。NVIDIAは、Pegasusが自動車業界で最も厳格なASIL-D認証を取得したレベル5システムとして初めてとなると主張しています。

現在のページ: ページ 1

次のページ 2ページ

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。