
イーロン・マスク氏のAI企業xAIは、ColossusスーパーコンピュータのGPUを100万基以上に拡張する予定だと、フィナンシャル・タイムズ紙が報じています。拡張後のColossusマシンは、世界で最も強力なスーパーコンピュータの一つとなるでしょう。しかし、そのためには多額の投資、供給、そしてインフラの整備が必要になります。
Grokを支える大規模言語モデルの学習に使用されているColossusは、既に10万基以上のNvidia製H100プロセッサを運用しており、まもなくGPU数を倍増させ、単一施設内で稼働する最大のスーパーコンピュータとなる予定です。GPU数を増やす計画は現在進行中ですが、これには相当の時間と労力がかかります。このミッションを達成するために、xAIはNvidia、Dell、Supermicroと協力しています。さらに、Colossusが拠点を置くテネシー州メンフィスでは、この取り組みを支援するために専用のxAI運用チームを設立したと報じられています。
xAIが今回の拡張において、現行世代のHopper GPUと次世代Blackwell GPUのどちらを使用する予定かは不明です。BlackwellプラットフォームはHopperよりもスケーラビリティに優れていると予想されているため、現行のHopperではなく次世代のBlackwell GPUを使用する方が理にかなっています。しかしいずれにせよ、NVIDIA製品の需要が圧倒的であるため、80万~90万個のAI GPUを確保するのは困難です。もう一つの課題は、100万個のGPUを最大限の効率で連携させることであり、この点でもBlackwellの方が理にかなっています。
もちろん、この事業拡大には莫大な資金が必要です。1台あたり数万ドルかかるGPUに加え、電源と冷却のためのインフラも整備する必要があるため、投資額は数百億ドルに達する可能性があります。xAIは今年110億ドルを調達し、最近さらに50億ドルを確保しました。現在、同社の評価額は450億ドルです。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。