Biren Technologyは、主に人工知能(AI)と高性能コンピューティング(HPC)向けに設計された初のGPUを正式に発表しました。同社によると、最上位機種であるBR100 GPUは、特定のワークロードにおいてはNVIDIAのA100チップやH100チップに匹敵する性能を備えながら、その複雑性はNVIDIAのH100コンピューティングGPUに匹敵するとのことです。
Birenの最初のコンピューティングGPUファミリーには、2つのチップが含まれています。BR100は最大256 FP32 TFLOPSまたは2 INT8 PetaFLOPSの性能を約束し、BR104は最大128 FP32 TFLOPSまたは1 INT8 PetaFLOPSの性能を約束します。
最上位モデルの BR100 には、4096 ビット インターフェイス (1.64 TB/秒) を備えた 64GB の HBM2E メモリが搭載されており、ミッドレンジの BR104 には、2048 ビット インターフェイス (819 GB/秒) を備えた 32GB の HBM2E メモリが搭載されています。
スワイプして水平にスクロールします
行0 - セル0 | ビレン BR104 | ビレン BR100 | エヌビディアA100 | エヌビディア H100 |
フォームファクター | FHFLカード | OAMモジュール | SXM4 | SXM5 |
トランジスタ数 | ? | 770億 | 542億 | 800億 |
ノード | N7 | N7 | N7 | 4N |
力 | 300W | 550W | 400W | 700W |
FP32 テラフロップス | 128 | 256 | 19.5 | 60 |
TF32+ TFLOPS | 256 | 512 | ? | ? |
TF32 テラフロップス | ? | ? | 156/312* | 500/1000* |
FP16 TFLOPS | ? | ? | 78 | 120 |
FP16 TFLOPS テンソル | ? | ? | 312/624* | 1000/2000* |
BF16 TFLOPS | 512 | 1024 | 39 | 120 |
BF16 TFLOPS テンソル | ? | ? | 312/624* | 1000/2000* |
INT8 | 1024 | 2048 | ? | ? |
INT8 TFLOPS テンソル | ? | ? | 624/1248* | 2000/4000* |
* スパース性あり
どちらのチップもINT8、FP16、BF16、FP32、TF32+のデータ形式をサポートしているため、スーパーコンピューティング形式(例:FP64)については言及していません。ただし、Biren社によると、TF32+形式は従来のTF32よりも高いデータ精度を提供するとのことです。一方、BR100とBR104は、かなり強力なピークパフォーマンスを提供します。実際、もし同社がGPU固有の機能(テクスチャユニット、レンダリングバックエンドなど)をコンピューティングGPUに組み込み、適切なドライバを設計していれば、これらのチップは(少なくともシングルチップ構成と思われるBR104は)かなり驚異的なGPUになっていたでしょう。
コンピューティング機能に加えて、Biren の GPU は H.264 ビデオのエンコードとデコードもサポートできます。
BirenのBR100はOAMフォームファクタで提供され、最大550Wの消費電力を誇ります。このチップは、同社独自の8ウェイBLinkテクノロジーをサポートしており、システムあたり最大8基のBR100 GPUを搭載可能です。一方、300WのBR104は、FHFLデュアルワイドPCIeカードフォームファクタで提供され、最大3ウェイのマルチGPU構成をサポートします。EETrend(VideoCardz経由)によると、どちらのチップもPCIe 5.0 x16インターフェースを採用し、アクセラレータにはCXLプロトコルが採用されています。
Biren氏によると、両チップともTSMCの7nmクラスの製造プロセスで製造されているとのことだ(N7、N7+、N7Pのいずれを使用しているかは明らかにしていない)。大型のBR100には770億個のトランジスタが搭載されており、同じくTSMCのN7ノードで製造されているNvidia A100の542億個を上回っている。また、同社はTSMCのレチクルサイズの制限を克服するために、チップレット設計とファウンドリのCoWoS 2.5D技術を採用する必要があったと述べている。これは完全に理にかなっている。NvidiaのA100はレチクルサイズに近づいており、BR100はトランジスタ数が多いため、さらに大きくなるはずだからだ。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
仕様から判断すると、BR100 は基本的に 2 つの BR104 を使用していると推測できますが、開発者はこれを正式に確認していません。
Biren は、BR100 OAM アクセラレータを商品化するために、Inspur と協力し、2022 年第 4 四半期からサンプル出荷が開始される 8 ウェイ AI サーバーを開発しました。Baidu と China Mobile は、Biren のコンピューティング GPU を使用する最初の顧客の 1 つになります。
アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。