24
D-Waveの「Quadrant」機械学習は少ないデータでより多くのことを実現する

D-Waveは、CPU/GPUと量子アニーリングコンピュータの両方を活用した機械学習サービスを提供する新事業ユニット「Quadrant」を発表しました。D-WaveのQuadrantアルゴリズムは、膨大な量のラベル付きデータを必要とする従来のディープラーニングソリューションと比較して、より少ないトレーニングデータでより効率的に正確な結果を提供できます。

機械学習を次のレベルへ

D-Wave の Quadrant Machine Learning シニアディレクターの Handol Kim 氏は、次のように述べています。

機械学習は、ほぼあらゆる業界において効率性とイノベーションを加速させる可能性を秘めています。Quadrantのモデルは、少量のラベル付きデータを用いてディープラーニングを実行できます。当社の専門家は、最適なモデルの選択と実装をサポートし、より多くの企業がこの強力なテクノロジーを活用できるよう支援します。

現在市販されている機械学習(ML)や人工知能(AI)ソリューションのほとんどは、学習の世界で効果的に使用できる正確なモデルを構築するために、何百万ものデータポイントを必要とします。例えば、猫を認識できるMLモデルを構築したい場合、何百万枚もの猫の写真で学習させる必要があります。


物体を認識する必要がある場合、アルゴリズムにその物体の100万通りのバージョンを提示できるのであれば、これは問題ではありません。しかし、何かについて100万通りのデータポイントを取得するのが容易でない場合は、状況はより困難になります。

例えば、極めてまれな皮膚疾患を高精度で認識するモデルを学習させたい場合、その皮膚疾患が人体でどのように現れるかを示す膨大な画像サンプルは必要ないでしょう。また、そのような画像がほんの数枚しかない場合、正確で信頼性の高いモデルを構築することはできず、実用には適さないでしょう。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

新しいクアドラントソリューションの仕組み

D-Wave社によると、現状のディープラーニングニューラルネットワークは、大量のデータだけでなく、アノテーションデータも必要としており、これも非常にコストがかかる可能性があるとのことです。つまり、アルゴリズムに何百万枚もの猫の写真を入力するだけでなく、画像内の物体が猫であることを実際に教え込む必要があるということです。ラベル付きデータを用いたトレーニングは、教師あり学習とも呼ばれます。


D-Waveの半教師あり学習アルゴリズムは、検索エンジンやソーシャルメディアでよく見られるような「ノイズの多い」ラベル付きの画像(入手コストも低い)を利用できます。また、ラベルなしデータや少量のラベル付きデータを使用して、正確なモデルを学習することも可能です。


D-Wave社は、同社のアルゴリズムの応用分野として、バイオインフォマティクス、医用画像、金融サービス、通信などを挙げています。同社は既に、世界的な医療技術プロバイダーであるSiemens Healthineers社と提携しています。両社は、医療機器を正確に識別できる機械学習ソリューションを開発し、CATARACTSグランドチャレンジで優勝を果たしました。このソリューションは、コンピュータ支援による介入にも活用できる可能性があります。

ルシアン・アルマスは、Tom's Hardware USの寄稿ライターです。ソフトウェア関連のニュースやプライバシーとセキュリティに関する問題を取り上げています。