37
報道:インテル、AI企業ハバナ・ラボを10億ドル超で買収へ交渉中

(画像クレジット:Shutterstock)

インテルは、ディープラーニングチップのスタートアップ企業であるハバナ・ラボを10億ドル超で買収する交渉を行っている可能性があると、火曜日の報道で報じられた。これは、2016年のモビディウスとナーバーナに続き、インテルにとって3件目の大型人工知能(AI)スタートアップ買収となる。

イスラエルのメディアCalcalist傘下のテクノロジーメディアCTechは、この件に詳しい匿名の情報筋を引用して報じた。関係者によると、インテルは「交渉が進んでいる」とのことで、買収額は10億ドルから20億ドルと見込まれている。これは、2017年にイスラエルに拠点を置くMobileyeを153億ドルで買収して以来、インテルにとって最大の買収となる。

IntelもHabana Labsもこの噂には反応しなかった。

数あるAIスタートアップ企業の一つであるハバナ・ラボは、3Dセンシング企業プライムセンス(2013年にアップルに3億6000万ドルで買収された)の元幹部2人によって2016年に設立された。同社の目標は、より高性能、拡張性、コスト、そして消費電力に優れたディープラーニングのトレーニングおよび推論用プロセッサを「ゼロから」開発することだ。同社はこれまでに総額1億2000万ドルを調達し、120人の従業員を擁している。2018年11月に行われた直近の投資ラウンドでは、インテル・キャピタルが主導し、7500万ドルの調達が行われた。当時、ハバナのCEOは、インテルはハバナと提携する予定はないと述べていた。

この取引が成立すれば、インテルのポートフォリオに注目すべき新たな一手となるでしょう。インテルはここ数年、エッジからデータセンター、CPUからASIC(特定用途向け集積回路)に至るまで、AI機能に加え、ソフトウェアによる実現にも投資してきました。 

2016年、インテルはエッジAIおよびビジョンAIを専門とするMovidiusを買収し、Movidiusは最近Keem Bay VPU(ビジョン・プロセッシング・ユニット)を発表しました。また、2016年には、ディープラーニング学習用チップ市場への参入を目指し、Nervanaを買収しました(買収額は3億5000万ドルと報じられています)。インテルは推論用NNP-Iも自社開発しています。そのため、Habana Labsの買収は、意外にも、インテルがAIポートフォリオに依然として課題を抱えていることを示唆している可能性があります。

Gaudi: Habanaのディープラーニングトレーニングチップ

画像

1

2

(画像提供:Habana Labs)

HabanaのトレーニングチップはGaudi(PDF)と呼ばれています。Nervanaと同様に、そのアーキテクチャはTensorプロセッサコア(TPC)をベースとしており、1TBpsのHBM2メモリを32GB搭載し、PCIe 4.0をサポートしています。また、INT8やBF16といった一般的なDL数値形式もサポートしています。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Gaudiの際立った特徴は、数百個のチップへのスケールアウトを可能にする相互接続です。これは、最大10個の100Gbpsイーサネットポートを介して2Tbpsの双方向スループットを実現する、統合イーサネット経由のリモートダイレクトメモリアクセス(RDMA)エンジンを搭載した初のAIチップです。RDMAとは、チップが他のチップのメモリに直接アクセスできることを意味します(オペレーティングシステムを介さずに)。イーサネットの利点は、スイッチが容易に利用できるため、PCIeスイッチや専用のNICが不要であることです。 

パフォーマンス面では、140W TDPチップ1個でResNet-50において毎秒1,650枚のスループットを実現し、消費電力は半分のNvidia Tesla V100と比較して14%高い数値となっています。これにより、ワットあたりの毎秒処理枚数は2倍以上の効率となります。チップ数が増えるほど、この差はさらに大きくなります。MLPerf v0.5に基づくと、640個のチップで毎秒8億4,540万枚のスループットを達成するのに対し、80個のDGX-1を搭載したV100ベースのシステムでは毎秒21万8,300枚のスループットを達成しました。512個のチップを搭載したGaudiシステムの相対効率は80%であるのに対し、V100システムでは30%未満です。

Goya: ディープラーニング推論チップ

画像

1

3

(画像提供:Habana Labs)

Habana社はまた、HL-1000 Goya (PDF) チップを搭載した、世界初の商用ディープラーニング推論プロセッサを開発したと主張しています。詳細は不明ですが、完全にプログラム可能なVLIW TPCを搭載し、主要なフレームワークをすべてサポートしています。

Habana 社は、Nvidia の Tesla T4 と比べてパフォーマンスが最大 3 倍、効率が 2 倍高く、レイテンシも大幅に低いと主張している。