82
中国Birenの新型GPUは770億個のトランジスタを搭載し、2PFLOPSのAI性能を実現

Biren Technologyは、主に人工知能(AI)と高性能コンピューティング(HPC)向けに設計された初のGPUを正式に発表しました。同社によると、最上位機種であるBR100 GPUは、特定のワークロードにおいてはNVIDIAのA100チップやH100チップに匹敵する性能を備えながら、その複雑性はNVIDIAのH100コンピューティングGPUに匹敵するとのことです。 

Birenの最初のコンピューティングGPUファミリーには、2つのチップが含まれています。BR100は最大256 FP32 TFLOPSまたは2 INT8 PetaFLOPSの性能を約束し、BR104は最大128 FP32 TFLOPSまたは1 INT8 PetaFLOPSの性能を約束します。  

最上位モデルの BR100 には、4096 ビット インターフェイス (1.64 TB/秒) を備えた 64GB の HBM2E メモリが搭載されており、ミッドレンジの BR104 には、2048 ビット インターフェイス (819 GB/秒) を備えた 32GB の HBM2E メモリが搭載されています。 

スワイプして水平にスクロールします

行0 - セル0ビレン BR104ビレン BR100エヌビディアA100エヌビディア H100
フォームファクターFHFLカードOAMモジュールSXM4SXM5
トランジスタ数?770億542億800億
ノードN7N7N74N
300W550W400W700W
FP32 テラフロップス12825619.560
TF32+ TFLOPS256512??
TF32 テラフロップス??156/312*500/1000*
FP16 TFLOPS??78120
FP16 TFLOPS テンソル??312/624*1000/2000*
BF16 TFLOPS512102439120
BF16 TFLOPS テンソル??312/624*1000/2000*
INT810242048??
INT8 TFLOPS テンソル??624/1248*2000/4000*

* スパース性あり

どちらのチップもINT8、FP16、BF16、FP32、TF32+のデータ形式をサポートしているため、スーパーコンピューティング形式(例:FP64)については言及していません。ただし、Biren社によると、TF32+形式は従来のTF32よりも高いデータ精度を提供するとのことです。一方、BR100とBR104は、かなり強力なピークパフォーマンスを提供します。実際、もし同社がGPU固有の機能(テクスチャユニット、レンダリングバックエンドなど)をコンピューティングGPUに組み込み、適切なドライバを設計していれば、これらのチップは(少なくともシングルチップ構成と思われるBR104は)かなり驚異的なGPUになっていたでしょう。

コンピューティング機能に加えて、Biren の GPU は H.264 ビデオのエンコードとデコードもサポートできます。 

ビレンテクノロジー

(画像提供:Biren Technology)

BirenのBR100はOAMフォームファクタで提供され、最大550Wの消費電力を誇ります。このチップは、同社独自の8ウェイBLinkテクノロジーをサポートしており、システムあたり最大8基のBR100 GPUを搭載可能です。一方、300WのBR104は、FHFLデュアルワイドPCIeカードフォームファクタで提供され、最大3ウェイのマルチGPU構成をサポートします。EETrend(VideoCardz経由)によると、どちらのチップもPCIe 5.0 x16インターフェースを採用し、アクセラレータにはCXLプロトコルが採用されています。 

ビレンテクノロジー

(画像提供:Biren Technology)

Biren氏によると、両チップともTSMCの7nmクラスの製造プロセスで製造されているとのことだ(N7、N7+、N7Pのいずれを使用しているかは明らかにしていない)。大型のBR100には770億個のトランジスタが搭載されており、同じくTSMCのN7ノードで製造されているNvidia A100の542億個を上回っている。また、同社はTSMCのレチクルサイズの制限を克服するために、チップレット設計とファウンドリのCoWoS 2.5D技術を採用する必要があったと述べている。これは完全に理にかなっている。NvidiaのA100はレチクルサイズに近づいており、BR100はトランジスタ数が多いため、さらに大きくなるはずだからだ。 

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

仕様から判断すると、BR100 は基本的に 2 つの BR104 を使用していると推測できますが、開発者はこれを正式に確認していません。 

Biren は、BR100 OAM アクセラレータを商品化するために、Inspur と協力し、2022 年第 4 四半期からサンプル出荷が開始される 8 ウェイ AI サーバーを開発しました。Baidu と China Mobile は、Biren のコンピューティング GPU を使用する最初の顧客の 1 つになります。 

ビレンテクノロジー

(画像提供:Biren Technology)

アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。