予測ジョブ¶
予測ジョブの定義を表示および管理するには、ダッシュボードでデプロイを選択し、ジョブ定義 > 予測ジョブタブに移動します。
ジョブ定義のアクションメニュー をクリックして、以下に示すいずれかのアクションを選択します。
アクション | 説明 |
---|---|
ジョブ履歴を表示 | コンソール > バッチジョブタブを表示し、ジョブ定義から生成されたすべてのジョブを一覧表示します。 |
今すぐ実行 | |
定義を表示/編集 | 予測ジョブの権限に応じて、ジョブ定義を表示するか、または更新して保存することができます。 |
定義の有効/無効化 | |
定義のクローン | |
定義を削除 |
共有されたジョブ定義
共有されたジョブ定義は自分で定義したものと一緒に表示されます。しかし、データレジストリの予測ソースにアクセスできない場合、データセットIDは[redacted]となります。
適切な権限があれば、上で定義されたジョブ定義のアクションを実行できます。 For information on which actions are available for each deployment role, see the roles and permissions documentation.
_オーナー_権限を持っている場合、定義を編集をクリックして、共有されたジョブ定義を編集できます。 ソース設定を編集するには、ソースのタイプが資格情報に依存している場合、またはデータレジストリのデータセットが共有されていない場合、接続をリセットするをクリックして、新しいソースのタイプを設定する必要があります。
DataRobotでは、接続の資格情報を共有できません。そのため、接続先の設定は編集できません。接続をリセットするをクリックし、_ご使用の_資格情報で新しい宛先タイプを設定する必要があります。
デプロイの_オーナー_として、他の情報を自由に編集できます。また、予測ソースデータセットがデータレジストリのものであり、_かつ_共有されている場合は、既存の接続を直接編集することができます。
定期的なバッチ予測ジョブのスケジュール¶
ジョブ定義は、バッチ予測ジョブを作成するための柔軟なテンプレートです。 DataRobot内部に定義を保存し、ワンクリック、APIコール、またはスケジュールによる自動実行で、新たなジョブを実行できます。 スケジュールされたジョブでは、各リクエストに対して接続、認証、予測のオプションを指定する必要はありません。
デプロイのジョブ定義を作成するには、予測 > 予測ジョブタブに移動して、+ ジョブ定義を追加をクリックします。 次の表では、新しい予測ジョブ定義タブで利用可能な情報とアクションについて説明します。
フィールド名 | 説明 | |
---|---|---|
1 | 予測ジョブ定義名 | デプロイのために作成する予測ジョブの名前を入力します。 |
2 | 予測ソース | Set the source type and define the connection for the data to be scored. |
3 | 予測オプション | Configure the prediction options. |
4 | 時系列オプション | Specify and configure a time series prediction method. |
5 | 予測先 | |
6 | ジョブスケジュール | Toggle whether to run the job immediately and whether to schedule the job. |
7 | 予測ジョブ定義を保存 |
設定が完了したら、予測ジョブ定義を保存(または、このジョブをすぐに実行が有効になっている場合は、予測ジョブ定義を保存して実行)をクリックします。
備考
新しい予測ジョブ定義タブでの入力が完了すると、バッチ予測APIに必要な詳細が設定されます。 Reference the Batch Prediction API documentation for details.
予測ソースの設定¶
予測ソース(入力アダプターとも呼ばれます)を選択します。 To set a prediction source, complete the appropriate authentication workflow for the source type.
データレジストリのソースの場合、ジョブ定義には、変更日、ソースを設定したユーザー、およびアセットの状態を表すバッジ(この場合はSTATIC)が表示されます。
予測ソースを設定すると、DataRobotはそのデータがデプロイ済みモデルに適用可能であるかを検証します。
備考
DataRobotは、データソースがデプロイ済みモデルに適用可能であるかどうかをできる限り検証しますが、すべてのケースで検証できるわけではありません。 DataRobotは、データレジストリ、ほとんどのJDBC接続、Snowflake、Synapseで検証を行います。
ソース接続タイプ¶
以下の接続タイプを選択すると、フィールドの説明が表示されます。
備考
接続の参照時に無効なアダプターは表示されません。
データベース接続
クラウドストレージ接続
- Azure
- Google Cloud Storage (GCP)
- S3
データウェアハウス接続
その他
ラングラーデータの接続
バッチ予測ジョブのWranglerレシピは、Snowflakeデータ接続またはAIカタログ/データレジストリから取り出したデータをサポートします。
サポートされているデータソースの詳細については、バッチ予測でサポートされているデータソースを参照してください。
予測オプションの設定¶
予測結果に含める情報を指定します。
要素 | 説明 | |
---|---|---|
1 | 予測結果に追加の特徴量値を含める | |
2 | 予測の説明を含める | |
3 | 予測外れ値警告を含める | Includes warnings for outlier prediction values (only available for regression model deployments). |
4 | データ探索のために予測を保存 | Tracks data drift, accuracy, fairness, and data exploration (if enabled for the deployment). |
5 | チャンクサイズ | |
6 | 予測リクエストの同時実行 | |
7 | 予測ステータスを含める | 予測のステータスを含む列を追加します。 |
8 | デフォルトの予測インスタンスを使用 | |
9 | 列名の再マッピング |
時系列オプションの設定¶
時系列データ要件
時系列モデルで予測を作成するには、特定の形式のデータセットが必要です。 形式は時系列プロジェクトの設定に基づきます。 予測データセットに正しい履歴行、予測行、および事前に既知の特徴量が含まれていることを確認します。 さらに、DataRobotが時系列データを確実に処理できるようにするには、次の要件を満たすようにデータセットを設定してください。
- 予測行をタイムスタンプでソートします。最も古い行が最初に表示されます。
- 複数系列では、予測行を系列IDでソートし、さらにタイムスタンプでソートして、古い順に表示します。
DataRobotがサポートする系列の数には制限はありません。 The only limit is the job timeout, as mentioned in Limits. For dataset examples, see the requirements for the scoring dataset.
時系列オプションを設定するには、時系列予測法で、予測ポイントまたは予測範囲を選択します。
予測ポイント オプションで、予測を開始する特定の日付を選択し、予測ポイントで選択方法を定義します。
-
自動的に設定、DataRobotはスコアリングデータに基づいて予測ポイントを選択します。
-
相対:ジョブ時間からのオフセットで、スケジュールされたジョブの実行時間からオフセットする月、日、時間、分の数を設定して、予測ポイントを設定します。 オフセットの適用方法に応じて、ジョブの時間前またはジョブの時間後をクリックします。
-
手動で設定:日付セレクターを使用して開始および終了の日付を手動で指定し、特定の日付範囲を設定します。
(予測ポイントから将来の行を予測するのではなく)一括で過去の予測を行う場合は、予測範囲 オプションを選択し、予測範囲の選択で、選択方法を定義します。
-
自動、予測は選択した時間範囲内のすべての予測距離を使用します。
-
手動:日付セレクターを使用して開始および終了の日付を手動で指定し、特定の日付範囲を設定します。
さらに、高度なオプションを表示をクリックし、事前に既知の列の欠損値を無視するを有効にすると、指定されたソースデータセットの事前に既知の列で欠損値があっても、予測を行うことができます。ただし、これは計算された予測に悪影響を及ぼす可能性があります。
予測先の設定¶
予測先(出力アダプターとも呼ばれます)を選択します。 Then, complete the appropriate authentication workflow for the destination type.
さらに、高度なオプションを表示をクリックして、定期的な間隔で結果をコミットし、カスタムコミット間隔を定義して、データ宛先に書き込み操作をコミットする頻度を示すことができます。
宛先の接続タイプ¶
以下の接続タイプを選択すると、フィールドの説明が表示されます。
備考
接続の参照時に無効なアダプターは表示されません。
データベース接続
クラウドストレージ接続
- Azure
- Google Cloud Storage (GCP Cloud)
- S3
データウェアハウス接続
予測ジョブのスケジュール¶
予測ジョブは、スケジュールに従って自動的に実行されるように設定することができます。 ジョブ定義を作成する際に、ジョブスケジュールをオンに切り替えます。 頻度(毎日、毎時、毎月など)と時間帯を指定して、ジョブの実行スケジュールを定義します。
さらに詳細な指定をする場合は、高度なスケジューラーを使用するを選択します。 予測ジョブの実行時刻を分単位で正確に指定することができます。