96
Nvidiaは、GPU設計を加速するためのAIデータセットの構築を支援するコンテストを共同主催しています。
AIを開発するためのGPUを開発するAI
(画像クレジット:Shutterstock)

大規模言語モデル(LLM)はコンテンツ生成能力に優れているものの、ハードウェア設計にはそれほど長けていません。この弱点は、モデルを学習するためのハードウェア設計データが不足していることにあると考え、NVIDIA、ジョージア工科大学などが、必要なオープンソースの公開データセットの作成を支援するコンテストを開催しました。

NVIDIAの設計自動化研究ディレクターであるHaoxing (Mark) Ren氏は最近、X(旧Twitter)におけるこのコラボレーションを発表しました。Ren氏は、ハードウェア設計に特化した高品質データの不足が「LLM支援ハードウェア設計のボトルネックの一つ」であると述べています。これらの欠点に対処するため、NVIDIAと他の企業はLLM支援ハードウェアコード生成に関するICCADコンテストを開催しました。

LLMの支援を受けてGPUやその他のハードウェアを設計する現在の取り組みには、「広範囲にわたる人間による介入」が必要です。LLMによって作成された設計は、多くの場合、合成不可能または機能しないか、あるいは単純すぎるか非実用的です。研究者たちは、これは事前学習中に高品質なハードウェア設計データへの露出が不十分であることが原因だと考えています。

高品質なデータの不足は、LLM支援ハードウェア設計におけるボトルネックの一つとして広く認識されています。オープンソースで大規模かつ高品質なデータセットを開発するため、@ICCAD と EIC Lab @GaTech の共同で LLM4HWDesign コンテストを開催します。https://t.co/qvwLZUlOVh 2024年7月8日

NVIDIAのプロジェクトが社内の大規模Verilogコードデータセットを用いて成功を収めた事例に注目し、主催者は既存のVerilogコードデータセットを拡充することを決定しました。このコンテストは、大規模かつ高品質なハードウェア設計コードデータセットを構築し、最終的にオープンソース化することを目指しています。

LLM4HWDesignコンテストは2つのフェーズで実施されます。第1フェーズはデータサンプル収集で、2024年8月10日に終了します。第2フェーズでは、8月20日から10月1日まで、フェーズIで収集されたデータセットの改善と微調整が行われます。フェーズIでデータセットを収集する際、コンテスト参加者は既存のVerilogデータセットから開始し、それを拡張していきます。

フェーズIIでは、参加者はデータフィルタリングを用いて低品質データを除去し、収集されたデータサンプルに対してより正確な説明を自動的に生成する技術を開発します。最終的には、LLMの学習プロセスを支援するラベリング戦略を構築します。

LLM4HWDesignコンテストの優勝者は、2024年10月末に開催されるIEEE/ACMの国際コンピュータ支援設計会議で発表されます。Nvidiaと全米科学財団がこのコンテストを後援しており、コンテストで得られる表彰に加えて、いくつかの貴重な賞が授与されます。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

  • 1 位賞: Nvidia RTX 4080 GPU 1 個とチームあたり 2,000 ドル。
  • 第 2 位賞: Nvidia RTX 4080 GPU 1 個とチームあたり 1,000 ドル。
  • 3 位賞: Nvidia RTX 4070 GPU 1 個とチームあたり 500 ドル。

ジェフ・バッツは10年以上にわたりテクノロジーニュースを取材しており、彼のIT経験はインターネット誕生以前から培われてきました。そう、彼は9600ボーが「高速」と呼ばれていた時代を今でも覚えています。特にDIYやメーカー関連の話題、そして最先端のテクノロジーに関する記事を好んで取り上げています。