最近の HotChips や現在開催中の Supercomputing 2017 トレードショーをざっと見てみればすぐにわかるように、AI はデータ センターや HPC アプリケーションに取って代わり始めています。
NVIDIAのCEO、ジェンスン・フアン氏は、Supercomputing 2017のステージに登壇し、同社が自動運転プログラム向けに独自のAIスーパーコンピュータを開発中であることを発表しました。NVIDIAは、この新しいスーパーコンピュータが世界のAIスーパーコンピュータのトップ10にランクインすると予測しており、これについては後ほど詳しくお伝えします。
Intelは最近、AMDで名を馳せたラジャ・コドゥリ氏を筆頭とする新たなコア&ビジュアルコンピューティング事業グループを設立し、ディスクリートGPUだけでなく、エッジからデータセンターまで拡張可能な差別化されたグラフィックススタックの開発を目指すと発表した。この発表は新たな脅威の兆しを見せている。AMDは、競合製品のRadeon Instinct GPUと組み合わせたEPYCプラットフォームの大幅な普及を享受しており、これは今回の展示会の大きなテーマとなっている。一方、多くのFPGAおよびASICベンダーも、急成長を遂げるAIセグメントのシェア獲得を競い合っている。
展示会場には、近日中にご紹介する予定の複数のベンダーによる Volta V100 のデモが満載されており、また Nvidia も複数の AI 分野での進捗状況について概要を説明しました。
NvidiaのSaturnV AIスーパーコンピュータ
画像
1
の
3

NVIDIAはまた、自社製スーパーコンピュータ「SaturnV」を660基のNVIDIA DGX-1ノード(ノードの詳細はこちら)にアップグレードし、5列に分散配置すると発表した。各ノードには8基のTesla V100が搭載され、合計5,280基のGPUが稼働する。これにより、FP16演算で最大660ペタフロップス(ほぼエクサフロップス)、FP64演算で最大40ペタフロップスを実現。同社はSaturnVを自社の自動運転車開発プログラムに活用する予定だ。
驚くべきことに、NVIDIAはSaturn Vが世界のAIスーパーコンピュータのトップ10に楽々と入り、完成すればトップ5入りする可能性もあると主張しました。世界のトップクラスのスーパーコンピュータの多くが国立機関によって運用されていることを考えると、これは非常に印象的です。NVIDIAとIBMは、オークリッジ国立研究所でSummitスーパーコンピュータの開発も進めています。Summitは、最大3エクサフロップスのAI性能を備え、現在中国にあるトップのスーパーコンピュータの座を奪うと予想されています。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
エコシステムの拡大
画像
1
の
3

NVIDIAは、210億個のトランジスタを搭載した815mm²のダイと16GBのHBM2を搭載した大型GPU「V100」が、すべての主要システムベンダーおよびクラウドベンダーに採用されたと発表しました。採用企業には、Dell EMC、HPE、Huawei、IBM、Lenovo、そして多数のホワイトボックスサーバーベンダーが含まれます。AI開発は急速に拡大しており、多くのスタートアップ企業、企業、学術機関が新製品や機能を急速に開発していますが、必要なインフラストラクチャの購入と管理がAIの導入を阻む可能性があります。
AWS、Azure、Google Cloud、Alibaba、Tencentなど、主要なクラウドサービスはすべて、Voltaベースのクラウドインスタンスを提供しています。Microsoftは最近、11月に提供開始予定の新しいクラウドベースのVoltaサービスを発表しました。また、CUDAフレームワークでは最大500のアプリケーションをサポートしています。
画像
1
の
9

NVIDIAは、NVIDIA GPU Cloud (NGC) 上で、導入を簡素化する新しいHPCコンテナなどの新しいソフトウェアとツールも提供しています。これらのコンテナはDockerで動作し、将来的には他のコンテナアプリケーションのサポートも予定されています。これらのアプリケーションは、Pascal以降のGPU、HPCスーパーコンピューティングクラスター、そしてNVIDIAのDGXシステムで動作します。これらのコンテナは、Caffee、Torch、Pytorchなど、主要なフレームワークをすべてサポートしています。NVIDIAは、処理時間を数分単位まで短縮することに注力しています。
日本の産総研も、4,352基のTesla Volta V100 GPUをABCIスーパーコンピュータに搭載しました。このスーパーコンピュータは37ペタフロップスを超えるFP64演算性能を備え、国内最速のAIスーパーコンピュータとなっています。これは世界初のエクサフロップス級AIスーパーコンピュータです。
私たちは、最新の Tesla V100 搭載システムのいくつかを展示会場で探します。お楽しみに。
ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。