DataRobotサーバーレス予測環境の追加¶
予測環境*ページでは、利用可能なDataRobot予測環境を確認し、DataRobotサーバーレス予測環境を作成して、構成可能なコンピューティングインスタンス設定でスケーラブルな予測を行うことができます。
事前にプロビジョニングされたDataRobotサーバーレス環境
2024年11月より後に作成された組織は、予測環境ページで事前にプロビジョニングされたDataRobotサーバーレス予測環境にアクセスできます。
事前にプロビジョニングされたDataRobotサーバーレス環境
トライアルアカウントは、予測環境ページで事前にプロビジョニングされたDataRobotサーバーレス予測環境にアクセスできます。
事前にプロビジョニングされたDataRobotサーバーレス環境
DataRobot 10.2以上のセルフマネージド環境を利用している組織は、予測環境ページで事前にプロビジョニングされたDataRobotサーバーレス予測環境にアクセスできます。
Prediction intervals in DataRobot serverless prediction environments
In a DataRobot serverless prediction environment, to make predictions with time-series prediction intervals included, you must include pre-computed prediction intervals when registering the model package. If you don't pre-compute prediction intervals, the deployment resulting from the registered model doesn't support enabling prediction intervals.
DataRobotサーバーレス予測環境を追加するには:
-
コンソールで、予測環境、+ 予測環境を追加の順にクリックします。
-
予測環境を追加ダイアログボックスで、次のフィールドに入力します。
フィールド 説明 名前 予測環境にわかりやすい名前を入力します。 説明 (オプション)外部予測環境の説明を入力します。 プラットフォーム DataRobot Serverlessを選択します。 バッチジョブ 同時実行可能な最大ジョブ数 このサーバーレス環境の最大同時実行ジョブ数を、組織で定義されている最大数から減らします。 優先度 この環境でのバッチジョブの有用性を設定します。 同時に実行できるジョブの最大数はどのように定義されていますか?
同時に実行できるジョブ数には2つの上限があり、これらの上限はDataRobotがインストールされている環境によって異なります。 各バッチジョブには両方の上限が適用されます。つまり、予測環境でバッチジョブを実行するには、両方の条件を満たす必要があります。 最初の上限は、組織の管理者によって定義される_組織レベル_の上限(デフォルトは、_セルフマネージド_版では
30
、SaaS版では10
)です。この上限は、2つ目の上限より高くする必要があります。 2つ目の上限は、予測環境の作成者によってここで定義された_環境レベル_の上限です。この上限は、組織レベルの上限より低くする必要があります。 -
環境設定を行ったら、環境を追加をクリックします。
これで、予測環境ページから環境を利用できるようになりました。
モデルをDataRobotサーバーレス予測環境にデプロイする¶
事前にプロビジョニングされたDataRobotサーバーレス環境、または作成したサーバーレス環境を使用して、予測を行うモデルをデプロイできます。
モデルをDataRobotサーバーレス予測環境にデプロイするには:
-
プラットフォーム行の予測環境ページで、DataRobotサーバーレス予測環境を見つけ、モデルをデプロイする環境をクリックします。
-
詳細タブの使用状況の下のデプロイ列で、+ 新規デプロイを追加をクリックします。
-
互換性を有しデプロイするモデルパッケージを選択ダイアログボックスで、デプロイしたいモデルの名前を検索ボックスに入力し、モデルをクリックしてから、デプロイしたい_DataRobot_モデルのバージョンをクリックします。
-
モデルのバージョンを選択をクリックして、 デプロイ設定を構築します。
-
この環境でオンデマンド予測を設定するには、高度なオプションを表示をクリックし、高度な予測設定までスクロールダウンして、以下の自動スケーリングオプションを設定します。
フィールド 説明 最小コンピューティングインスタンス数 (Premium feature) Set the minimum compute instances for the model deployment. 組織が「常時」予測を利用できない場合、これは 0
に設定され、変更できません。 With the minimum compute instances set to0
, the inference server will be stopped after an inactivity period of 7 days. The minimum and maximum compute instances depend on the model type. For more information, see the compute instance configurations note.最大コンピューティングインスタンス数 Set the maximum compute instances for the model deployment to a value above the current configured minimum. コンピューティングリソースの使用を制限するには、最大値を最小値と同じに設定します。 The minimum and maximum compute instances depend on the model type. For more information, see the compute instance configurations note. プレミアム機能:常時予測
常時予測はプレミアム機能です。 コンピューティングインスタンスの最小設定を行うには、デプロイの自動スケーリングを管理する必要があります。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。
機能フラグ: デプロイの自動スケーリング管理を有効にする
コンピューティングインスタンスの設定
DataRobotモデルのデプロイの場合:
- デフォルトの最小値は0、デフォルトの最大値は3です。
- 最小値と最大値の限度は、組織の
max_compute_serverless_prediction_api
設定に基づいています。
カスタムモデルのデプロイの場合:
- デフォルトの最小値は0、デフォルトの最大値は1です。
- 最小値と最大値の限度は、組織の
max_custom_model_replicas_per_deployment
設定に基づいています。 - (LLM用に)GPUで実行する場合、最小値は常に1より大きくなります。
コンピューティングインスタンスの設定を更新する
デプロイ後にモデルで使用できるコンピューティングインスタンスの数を更新する必要がある場合、 設定 > 予測タブでこれらの設定を変更できます。
-
モデルをデプロイをクリックします。
コンピューティングリソースの可用性によっては、予測環境を予測で使用できるようになるには、デプロイ後数分かかることがあります。
予測の作成¶
DataRobotサーバーレス環境を作成し、その環境にモデルをデプロイしたら、リアルタイム予測やバッチ予測を行うことができます。
DataRobotサーバーレス予測環境でリアルタイム予測を行うには:
-
デプロイインベントリで、DataRobotサーバーレス環境に関連付けられたデプロイを見つけて開きます。 これを行うには、 フィルターをクリックし、DataRobotサーバーレスを選択して、フィルターを適用をクリックします。
-
DataRobotサーバーレス予測環境に関連付けられたデプロイで、予測 > 予測APIをクリックします。
-
予測APIスクリプトコードページの予測タイプで、リアルタイムをクリックします。
-
言語で、PythonまたはcURLを選択し、オプションでシークレットを表示を有効にして、スクリプトをクリップボードにコピーをクリックします。
-
PythonまたはcURLスニペットを実行して、DataRobotサーバーレスデプロイに予測リクエストを行います。
DataRobotサーバーレス予測環境でバッチ予測を行うには、UIでのバッチ予測または予測APIスクリプトでの予測の標準プロセスに従ってください。