DataRobotサーバーレス予測環境の追加¶
予測環境ページで、利用可能なDataRobot予測環境を確認し、DataRobotサーバーレス予測環境を作成して、設定可能なコンピューティングインスタンス設定でスケーラブルな予測を行うことができます。
事前にプロビジョニングされたDataRobotサーバーレス環境
2024年11月以降に設立された組織は、予測環境ページに事前にプロビジョニングされたDataRobotサーバーレス予測環境にアクセスできます。
事前にプロビジョニングされたDataRobotサーバーレス環境
トライアルアカウントをお持ちの場合、予測環境ページに事前にプロビジョニングされたDataRobotサーバーレス予測環境にアクセスできます。
事前にプロビジョニングされたDataRobotサーバーレス環境
DataRobot 10.2以上のセルフマネージド環境を利用している組織は、予測環境ページで事前にプロビジョニングされたDataRobotサーバーレス予測環境にアクセスできます。
DataRobotサーバーレス予測環境における予測間隔
DataRobotサーバーレス予測環境において、時系列予測間隔を含む予測を作成するには、 モデルパッケージを登録する際に、事前に計算された予測間隔を含める必要があります。 予測間隔を事前に計算しない場合、登録されたモデルから得られるデプロイは、 予測間隔の有効化をサポートしません。
DataRobotサーバーレス予測環境を追加するには:
-
デプロイ > 予測環境をクリックし、+ 予測環境を追加をクリックします。
-
予測環境を追加ダイアログボックスで、次のフィールドに入力します。
フィールド 説明 名前 予測環境にわかりやすい名前を入力します。 説明 (オプション)外部予測環境の説明を入力します。 プラットフォーム DataRobot Serverlessを選択します。 バッチジョブ 同時実行可能な最大ジョブ数 このサーバーレス環境の最大同時実行ジョブ数を、組織で定義されている最大数から減らします。 優先度 この環境でのバッチジョブの有用性を設定します。 同時に実行できるジョブの最大数はどのように定義されていますか?
同時に実行できるジョブ数には2つの上限があり、これらの上限はDataRobotがインストールされている環境によって異なります。 各バッチジョブには両方の上限が適用されます。つまり、予測環境でバッチジョブを実行するには、両方の条件を満たす必要があります。 最初の上限は、組織の管理者によって定義される_組織レベル_の上限(デフォルトは、_セルフマネージド_版では
30
、SaaS版では10
)です。この上限は、2つ目の上限より高くする必要があります。 2つ目の上限は、予測環境の作成者によってここで定義された_環境レベル_の上限です。この上限は、組織レベルの上限より低くする必要があります。 -
環境設定を行ったら、環境を追加をクリックします。
これで、予測環境ページから環境を利用できるようになりました。
モデルをDataRobotサーバーレス予測環境にデプロイする¶
事前にプロビジョニングされたDataRobotサーバーレス環境、または自身で作成したサーバーレス環境を使用して、モデルをデプロイして予測を行うことができます。
モデルをDataRobotサーバーレス予測環境にデプロイするには:
-
プラットフォーム行の予測環境ページで、DataRobotサーバーレス予測環境を見つけ、モデルをデプロイする環境をクリックします。
-
詳細タブの使用状況の下のデプロイ列で、+ 新規デプロイを追加をクリックします。
-
レジストリからモデルバージョンを選択ダイアログボックスで、デプロイするモデル名を検索ボックスに入力し、モデルをクリックしてから、デプロイする DataRobot モデルのバージョンをクリックします。
-
モデルのバージョンを選択をクリックして、 デプロイ設定を構築します。
-
この環境でオンデマンド予測を設定するには、高度なオプションの表示をクリックし、高度な予測設定まで下にスクロールして、次の自動スケーリングオプションを設定します。
フィールド 説明 最小コンピューティングインスタンス数 (プレミアム機能)モデルデプロイの最小コンピューティングインスタンスを設定します。 組織が「常時」予測を利用できない場合、これは 0
に設定され、変更できません。 最小コンピューティングインスタンス数を0
に設定すると、推論サーバーは、7日間の非アクティブ期間の後に停止します。 最小および最大のコンピューティングインスタンスは、モデルタイプによって異なります。 詳細については、 コンピューティングインスタンスの設定に関する注記を参照してください。最大コンピューティングインスタンス数 モデルデプロイの最大コンピューティングインスタンスを、現在設定されている最小値を超える値に設定します。 コンピューティングリソースの使用を制限するには、最大値を最小値と同じに設定します。 最小および最大のコンピューティングインスタンスは、モデルタイプによって異なります。 詳細については、 コンピューティングインスタンスの設定に関する注記を参照してください。 プレミアム機能:常時予測
常時予測はプレミアム機能です。 最小のコンピューティングインスタンスを設定するには、デプロイの自動スケーリング管理が必要です。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。
機能フラグ: デプロイの自動スケーリング管理を有効にする
コンピューティングインスタンスの設定
DataRobotモデルデプロイの場合:
- デフォルトの最小値は0で、最大値は3です。
- 最小値と最大値は、組織の
max_compute_serverless_prediction_api
設定から取得されます。
カスタムモデルデプロイの場合:
- デフォルトの最小値は0で、最大値は1です。
- 最小値と最大値は、組織の
max_custom_model_replicas_per_deployment
設定から取得されます。 - GPU(LLMの場合)で実行する場合、最小値は常に1よりも大きくなります。
コンピューティングインスタンスの設定を更新する
デプロイ後にモデルで使用できるコンピューティングインスタンスの数を更新する必要がある場合、 予測設定 タブでこれらの設定を変更できます。
-
モデルをデプロイをクリックします。
コンピューティングリソースの可用性によっては、予測環境を予測で使用できるようになるには、デプロイ後数分かかることがあります。
予測の作成¶
DataRobotサーバーレス環境を作成し、その環境にモデルをデプロイしたら、リアルタイム予測やバッチ予測を行うことができます。
DataRobotサーバーレス予測環境でリアルタイム予測を行うには:
-
デプロイインベントリで、DataRobotサーバーレス環境に関連付けられたデプロイを見つけて開きます。 これを行うには、 フィルターをクリックし、DataRobotサーバーレスを選択して、フィルターを適用をクリックします。
-
DataRobotサーバーレス予測環境に関連付けられたデプロイで、予測 > 予測APIをクリックします。
-
予測APIスクリプトコードページの予測タイプで、リアルタイムをクリックします。
-
言語で、PythonまたはcURLを選択し、オプションでシークレットを表示を有効にして、スクリプトをクリップボードにコピーをクリックします。
-
PythonまたはcURLスニペットを実行して、DataRobotサーバーレスデプロイに予測リクエストを行います。
DataRobotサーバーレス予測環境でバッチ予測を行うには、UIでのバッチ予測または予測APIスクリプトでの予測の標準プロセスに従ってください。