
イーロン・マスク氏は、テネシー州メンフィスのColossus Superclusterで10万基のNvidia H100 GPUを用いて学習されたxAIのLLM(ローカライズモデル)の最新バージョンであるGrok 3をリリースしました。マスク氏は約1週間前に、Grok 3の正式リリースが間近に迫っており、競合他社を凌駕する性能を発揮すると述べていました。本日、マスク氏はX(旧Twitter)のライブストリーミングでこのAIモデルを公開し、印象的なパフォーマンスベンチマーク結果を披露しました。
Grok-3の初期のベンチマークでは、この分野を席巻していることが判明しています。pic.twitter.com/KXubPhaA5x2025年2月18日
マスク氏はプレゼンテーションの冒頭で、「xAIとGrokの使命は宇宙を理解することです」と述べ、「何が起こっているのか? エイリアンはどこにいるのか? 人生の意味とは何か? 宇宙はどのように終わるのか? どのように始まったのか?」といった疑問に答えたいと説明した。さらに、「もちろん、たとえその真実が政治的に正しいとされることが時として矛盾するとしても、それは最大限に真実を追求するAIとなることです」と付け加えた。
AIに関する目標を語った後、マスク氏はGrok 3はGrok 2と比べて桁違いに高性能であり、非常に短期間でトレーニングできたと明言した。これは、xAIが並列トレーニングに膨大な数のGPUを使用したおかげだろう。セットアップにはわずか19日しかかからなかった。NVIDIAのCEO、ジェンスン・フアン氏によると、通常は4年かかるとのことなので、これは記録的な速さと言えるだろう。
Grok 3 は単なる LLM ではなく、複数のモデルからなるファミリーであり、最初にリリースされたのは Grok 3 と Grok 3 mini です。xAI は Grok 3 Reasoning と Grok 3 mini Reasoning も披露しました。これらは OpenAI 03-mini や DeepSeek R1 モデルに似ており、段階的な論理プロセスを通じて問題を解決します。
画像
1
の
2

xAIチームが示したベンチマークテストでは、Grok-3とGrok-3 miniモデルが、数学(AIME)、科学(GPQA)、コーディング(LCB)を含む複数のテストにおいて、Gemini-2 Pro、DeepSeek-V3、Claude 3.5 Sonnet、GPT-4oといった競合製品を凌駕する性能を示しました。Grokアプリからアクセスできる推論モデルも、同じベンチマークで競合製品を凌駕しています。さらに、GrokアプリにはDeepSearchという新機能が搭載されます。これは、質問に応じてインターネットを検索し、すべての情報を単一の回答に抽出します。
他の専門家たちはGrok 3への事前アクセスを許可されており、これらの主張を検証することができました。例えば、元テスラAIディレクターでOpenAIの創設者でもあるAndrej Karpathy氏は、Xでのテスト結果を共有し、Grok 3 + ThinkingはOpenAIのo1-proモデルに似ているものの、DeepSeek-R1やGemini 2.0 Flash Thinkingよりもわずかに優れていると述べています。これは実に素晴らしい成果であり、特にOpenAIとGoogleはxAIに対して大きな先行をとっています。
本日、Grok 3 の早期アクセスが付与されたため、ちょっとした雰囲気チェックを試せる最初の数人のうちの一人になったと思います。思考✅ まず、Grok 3 には最先端の思考モデル(「考える」ボタン)が搭載されており、私の「カタンの開拓者たち」では箱から出してすぐに素晴らしい結果が出ました… pic.twitter.com/qIrUAN1IfD 2025年2月18日
Grok 3はまずX Premium+加入者向けに提供されます。ただし、より高度な機能を利用したい方はSuperGrokに加入する必要があります。SuperGrokの料金は月額約30ドル、または年額約300ドルと噂されています。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
ジョウィ・モラレスは、長年のテクノロジー業界での実務経験を持つテクノロジー愛好家です。2021年から複数のテクノロジー系出版物に寄稿しており、特にテクノロジー系ハードウェアとコンシューマーエレクトロニクスに興味を持っています。