ディープラーニング用のGPU¶
プレミアム機能
GPUワーカーはプレミアム機能です。 この機能を有効にする方法については、DataRobotの担当者にお問い合わせください。
Support for deep learning models is increasingly important in an expanding number of business use cases. 一部のモデルはCPU上で実行できますが、他のモデルでは、適切なトレーニング時間を実現するために、 GPUが必要です。 これらの「重要な」ディープラーニングモデルを使用して効率的にトレーニング、ホスト、および予測を行うために、DataRobotは、アプリケーション内でNvidia GPUを活用します。 GPUでのトレーニングは、プロジェクトごとに設定でき、有効化すると、オートパイロットプロセスの一部として使用します。
GPUタスクのサポート¶
一部のブループリントでは、リポジトリに2つのバージョンが用意されており、DataRobotがCPUワーカーまたはGPUワーカーでトレーニングできるようになっています。 各バージョンは、特定のワーカータイプでトレーニングできるように最適化されており、識別バッジ(CPUまたはGPU)が付いています。 GPUバッジが付いたブループリントは、常にGPUワーカーでトレーニングされます。 それ以外のブループリントはすべて、CPUワーカーでトレーニングされます。
GPUブループリントを使用する際には、以下の点に注意してください。
- GPUブループリントは、トレーニングデータに画像またはテキスト特徴量が含まれている場合にのみリポジトリに存在します。
- 場合によっては、DataRobotはクイックまたはフルオートパイロットの一部としてGPUブループリントをトレーニングします。 GPUワーカーで追加のブループリントをトレーニングするには、リポジトリから手動で実行するか、包括モードで再トレーニングします。 (モデリングモードについては、こちらを参照してください。)
GPUワーカーを有効にする¶
GPUワーカーを有効化するには、高度なオプションを開き、 その他タブを選択します。
GPUワーカーの使用を許可ボックスをオンにします。このボックスは、GPUワーカーを、プロジェクトに使用するかどうかを制御します。 使用については、適切なブループリントが使用可能かどうか、およびGPUワーカーが使用可能かどうかによって異なります。 この設定が有効な場合、オートパイロットは常にCPUバリアントよりもGPUバリアントの実行を優先します。 たとえば、包括モードでは、CPUバリアントは実行されません。
GPUモデリングプロセス¶
手動またはオートパイロットでのブループリントのトレーニングがスケジュールされ、GPU機能が有効になっている場合:
-
DataRobotはブループリントを確認して、GPUワーカーでトレーニングできるモデルと、CPUワーカーでのみトレーニングできるモデルを判別します。
-
GPUワーカーのフラグが設定されたモデルは、GPUワーカーキューに送られます。それ以外のモデルはすべてCPUワーカーキューに送られます。
-
ワーカーキューには、トレーニングに使用されているCPUとGPUの数だけでなく、使用可能な合計数が表示されます。 使用可能な場合はGPUを追加して、キュー処理を増やせます。
-
モデルのトレーニングが完了すると、リーダーボードに表示されます。 プロジェクトがアクティブかどうかを示します。
-
モデルを再トレーニングすると、DataRobotは、元のトレーニングジョブと同じロジックを適用します。
機能に関する注意事項¶
-
CPUとGPUの浮動小数点の実装における固有の違いにより、GPUのない環境でGPUでトレーニングされたモデルを使用すると、矛盾が生じる可能性があります。 不整合は、モデルおよびデータセットによって異なりますが、重要でない可能性があります。
-
GPUでのトレーニングは、非決定的である場合があります。 同じパーティションで同じモデルをトレーニングすると、モデルが若干異なる場合があり、テストセットでのスコアリングは異なります。
-
GPUはトレーニングにのみ使用されます。予測やインサイトの計算には使用されません。
-
カスタム環境用のエディターロールはなく、カスタムモデル用のみです。