58
Nvidia Tech、AI推論の効率を大幅に向上

Nvidia は、TensorRT AI 推論ソフトウェアの第 3 世代、DeepStream ビデオ分析プラットフォーム、および CUDA テクノロジーの第 9 世代を発表しました。

数十年にわたり、人工知能(AI)技術が台頭しつつあるという噂は耳にしてきましたが、最近まで、そうしたアイデアはSFの世界の産物に過ぎませんでした。しかし今日、人工知能はもはやフィクションではなく、急速に科学的事実となりつつあります。Nvidiaが人工知能技術に強気であることは周知の事実です(そして、それには十分な理由があります)。同社は近年、AIとディープラーニング革命の最前線に位置づけられており、この分野で年々急速な進歩を遂げています。そして、その勢いが衰える兆しは当分見られません。昨日、GTC China 2017において、Nvidiaの創業者兼CEOであるジェンスン・フアン氏は、ディープラーニング推論のパフォーマンスと効率を向上させるいくつかの新技術を発表しました。創業者はまた、業界内で結んでいるパートナーシップの概要を説明し、NvidiaのディープラーニングAI技術が今後数年間で世界をどのように形作っていくのかを垣間見せてくれました。

第3世代TensorRTテクノロジー

NVIDIAは昨年9月、GPUインターフェースエンジンをTensorRTディープラーニング推論エンジンに置き換えました。NVIDIAのTensorRT推論エンジンの第一世代は、画像分類、セグメンテーション、物体検出などのタスクにおいて、GPUインターフェースエンジンの2倍のパフォーマンスを提供しました。 

NVIDIAは今年初め、TensorRT 2をリリースしました。これにより、INT8精度のパフォーマンスが最大45倍向上しました。また、NVIDIAは「画像キャプション、言語翻訳、その他のアプリケーション向けのシーケンスベースモデル」も導入しました。

Nvidiaは現在、TensorRT 3を提供しています。これにより、Tesla V100 GPUではTesla P100 GPUと比較して3.7倍のパフォーマンスを実現します。TensorRT 3は、Voltaハードウェア上でCPUのみのインターフェースと比較して「TensorFlowモデルを最大18倍高速に最適化および展開」できます。また、TensorRT 3は、CPUベースのニューラルネットワークと比較して、ResNet-50で40倍、OpenNMTニューラル機械翻訳システムで140倍のパフォーマンス向上を実現します。

TensorRT 3は、ニューラルネットワークの電力効率を新たなレベルに引き上げます。Huang氏によると、Telsa V100 GPUを8基搭載したHGXサーバー1台で、デュアルCPUサーバー160台を搭載したCPUベースのニューラルネットワークと同等の計算性能を実現できるとのことです。NVIDIAは8GPU搭載のHGXラックマウントサーバーの価格を明らかにしていませんが、CPUベースのサーバーの60万ドルから70万ドルよりも安価になるとしています。また、GPUベースのサーバーは、電力コストを65キロワットからわずか3キロワットへと大幅に削減します。

インテリジェントビデオ分析を簡素化

NVIDIAは、AI推論技術とビデオトランスコーディングおよびデータキュレーション技術を単一のAPIに統合することで、「スケーラブルでインテリジェントなビデオ分析(IVA)アプリケーションの開発を簡素化する」DeepStream SDKも発表しました。NVIDIAのDeepStream SDKは、「画像分類、シーン理解、ビデオ分類、コンテンツフィルタリング」機能を提供します。DeepStream SDKで作成されたアプリケーションは、NVIDIAのTeslaアクセラレーション・コンピュータ・プラットフォーム上で動作します。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

DeepStream SDK にはサンプル コードと事前トレーニング済みのディープラーニング モデルが含まれており、開発者がビデオ コンテンツを分類し、ビデオ ストリーム内のオブジェクトを検出できるソフトウェアを作成するのに役立ちます。

CUDA 9周年

NVIDIAは、TensorRT 3とDeepStream SDKのリリースと同時に、第9世代のCUDAテクノロジーもリリースしました。NVIDIAのCUDA GPUアクセラレーションライブラリの最新バージョンは、NVIDIAのVoltaプラットフォームのパワーを活用しています。同社によると、CUDA 9で開発されたHPCアプリケーションは、Volta GPU上で実行した場合、CUDA 8で構築されたアプリケーションと比較して最大1.5倍のパフォーマンス向上を実現します。   

CUDA 9アプリは、マルチGPU構成でもパフォーマンスが向上しています。特にVolta GPUでは、次世代NVLinkテクノロジーにより前世代の2倍のスループットを実現しています。

今すぐ入手可能

NVIDIA の 3 つの新技術はすべて、登録済みの NVIDIA 開発者にご利用いただけます。TensorRT 3、DeepStream SDK、CUDA 9 に関する詳細は、NVIDIA の開発者リソース ウェブサイトをご覧ください。

ケビン・カルボットはTom's Hardwareの寄稿ライターで、主にVRとARのハードウェアを扱っています。彼は4年以上にわたりTom's Hardwareに寄稿しています。