
AI推論に使用されるシステムの消費電力に関する懸念に対処するため、ハイパースケールクラウドサービスプロバイダー(CSP)のCloudflareは、AMDやNVIDIAのAI GPU以外のAIアクセラレータをテストしていると、ウォール・ストリート・ジャーナルが報じています。同社は最近、Positron AIのAtlasソリューションの試用を開始しました。このソリューションは、NVIDIAのH200と比較して消費電力をわずか33%削減し、H200を上回るとされています。
Positronは2023年に設立された米国企業で、推論に特化したAIアクセラレータを開発しています。AIトレーニング、AI推論、技術計算、その他幅広いワークロード向けに設計された汎用GPUとは異なり、Positronのハードウェアは、推論タスクを効率的かつ最小限の消費電力で実行できるようにゼロから構築されています。Positronの大規模Transformerモデル向け第一世代ソリューションはAtlasと呼ばれています。8基のArcherアクセラレータを搭載し、消費電力を大幅に削減しながら、NvidiaのHopperベースのシステムを凌駕するように設計されています。
注目すべきは、Positron AIがアリゾナ州にあるTSMCのFab 21でASICハードウェアを製造している点(つまり、N4またはN5プロセス技術を使用)と、カードの組み立ても米国で行われている点です。つまり、Positron AIはほぼ完全に米国製です。しかし、このASICは32GBのHBMメモリと組み合わせられているため、高度なパッケージング技術が採用されており、台湾で組み立てられている可能性が高いです。
Positron AI の Atlas システムと Archer AI アクセラレータは、Hugging Face などの広く使用されている AI ツールと互換性があり、OpenAI API 互換のエンドポイントを通じて推論リクエストを処理するため、ユーザーはワークフローに大きな変更を加えることなく導入できます。
Positronは、Valor Equity Partners、Atreides Management、DFJ Growthなどの投資家が主導した最近の5,160万ドルの資金調達ラウンドを含め、総額7,500万ドル以上の資金調達を実施しています。同社はまた、Asimovと呼ばれる第2世代AI推論アクセラレータの開発にも取り組んでおり、これは8ウェイTitanマシンで、2026年にはNvidiaのVera Rubinプラットフォームをベースとした推論システムに対抗すると予想されています。
Positron AIのAsimov AIアクセラレータは、ASICあたり2TBのメモリを搭載し、同社が公開した画像によると、HBMではなく別の種類のメモリを使用する予定です。また、ラックスケールシステムでの運用効率を高めるため、16Tb/sの外部ネットワーク帯域幅も備えています。合計16GBのメモリを搭載した8つのAsimov AIアクセラレータを搭載したTitanは、最大16兆個のパラメータを持つモデルを1台のマシンで実行できると予想されており、大規模生成AIアプリケーションのコンテキスト制限を大幅に拡大します。Positron AIによると、このシステムは複数モデルの同時実行もサポートし、1GPUあたり1モデルという制約を解消します。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
AI業界の電力需要の急増は警鐘を鳴らしています。AIモデルの学習に使用される大規模クラスターの中には、都市と同量の電力を消費しているものもあり、その影響は深刻化しています。AIモデルの大規模化とAIの利用拡大に伴い、状況はさらに悪化しています。つまり、推論に使用されるAIデータセンターの電力消費も急速に増加しているということです。Cloudflareは、現在Positron AIのハードウェアをテストしているアーリーアダプター企業の一つです。一方、Google、Meta、Microsoftといった企業は、電力消費を抑えるために独自の推論アクセラレーターを開発しています。
Google ニュースで Tom's Hardware をフォローすると、最新のニュース、分析、レビューをフィードで受け取ることができます。「フォロー」ボタンを忘れずにクリックしてください。
アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。