Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

定期的なバッチ予測ジョブのスケジュール

1回限りのバッチ予測を行うことも、定期的にバッチ予測ジョブをスケジュールすることもできます。 このセクションでは、バッチ予測ジョブを作成およびスケジュールする方法を示します。

Be sure to review the deployment and prediction considerations before proceeding.

予測ジョブ定義の作成

ジョブ定義は、バッチ予測ジョブを作成するための柔軟なテンプレートです。 DataRobot内部に定義を保存し、ワンクリック、APIコール、またはスケジュールによる自動実行で、新たなジョブを実行できます。 スケジュールされたジョブでは、各リクエストに対して接続、認証、予測のオプションを指定する必要はありません。

デプロイのジョブ定義を作成するには、予測 > ジョブ定義タブに移動します。 次の表では、新しい予測ジョブ定義タブで利用可能な情報とアクションについて説明します。

フィールド名 説明
予測ジョブ定義名 デプロイのために作成する予測ジョブの名前を入力します。
予測ソース ソースのタイプを設定し、スコアリングするデータの接続を定義します。
予測オプション 予測オプションを設定します
時系列オプション 時系列予測の方法‭を指定および設定します。
予測先 予測の出力先を示します。 宛先タイプを設定し、接続を定義します。
ジョブスケジュール ジョブをすぐに実行するかどうか、およびジョブをスケジュールするかどうかを切り替えます。
予測ジョブ定義を保存 このボタンをクリックして、ジョブ定義を保存します。 このジョブをすぐに実行トグルがオンになっている場合、このボタンは予測ジョブ定義を保存して実行に変わります。 検定エラーがある場合、このボタンは無効になっています。

設定が完了したら、予測ジョブ定義を保存(または、このジョブをすぐに実行が有効になっている場合は、予測ジョブ定義を保存して実行)をクリックします。

備考

新しい予測ジョブ定義タブでの入力が完了すると、バッチ予測APIに必要な詳細が設定されます。 詳細は、バッチ予測APIのドキュメントを参照してください。

予測ソースの設定

予測ソース(別名入力アダプター)を選択します。

予測ソースを設定するには、ソースのタイプに応じた適切な認証ワークフローを完了させます。

AIカタログソースの場合、ジョブ定義には、変更日、ソースを設定したユーザー、アセットの状態を表すバッジ(この場合はSTATIC)が表示されます。

予測ソースを設定すると、DataRobotはそのデータがデプロイ済みモデルに適用可能であるかを検証します。

備考

DataRobotは、データソースがデプロイ済みモデルに適用可能であるかどうかをできる限り検証しますが、すべてのケースで検証できるわけではありません。 DataRobotは、AIカタログ、ほとんどのJDBC接続、Snowflake、Synapseで検証を行います。

ソース接続タイプ

以下の接続タイプを選択すると、フィールドの説明が表示されます。

備考

接続の参照時に無効なアダプターは表示されません。

データベース接続

クラウドストレージ接続

データウェアハウス接続

その他

サポートされているデータソースの詳細については、バッチ予測でサポートされているデータソースを参照してください。

予測オプションの設定

予測結果に含める情報を指定します。

要素 説明
入力特徴量を含める 予測値と一緒に入力特徴量を予測結果ファイルに書き込みます。 特定の特徴量を追加するには、入力特徴量を含めるトグルを有効にして、特定の特徴量を選択し、絞り込む特徴量名を入力してから、特徴量を選択します。 データセットのすべての特徴量を含めるには、すべての特徴量を選択します。 追加できるのは元のデータセットに存在する特徴量(列)だけですが、その特徴量は、モデルの構築に使用した特徴量セットの一部である必要はありません。 派生した特徴量は含まれません
予測の説明を含める 予測の出力結果に予測の説明のための列を追加します。 If you can't enable Prediction Explanations, see Why can't I enable Prediction Explanations?
予測外れ値警告を含める 外れ値の予測値に対する警告を含めます(連続値モデルデプロイでのみ使用可能)。
予測のためのデータのドリフト、精度、公平性の追跡 データドリフト精度公平性を追跡します(デプロイで有効になっている場合)。
チャンクサイズ チャンクサイズの選択方法を調整します。 デフォルトでは、チャンクサイズは自動的に計算されます。この設定は、DataRobotの担当者から勧められた場合にのみ変更してください。 詳細については、チャンクサイズとは?を参照してください。
予測リクエストの同時実行 予測リクエストの同時実行数を制限します。 デフォルトでは、予測ジョブは利用可能な予測サーバーコアをすべて使用します。 リアルタイム予測用に処理能力を確保するには、同時予測リクエストの最大数に上限を設けます。
予測ステータスを含める 予測のステータスを含む列を追加します。
デフォルトの予測インスタンスを使用 予測インスタンスを変更できます。 トグルをオフにして、予測インスタンスを選択します。
Why can't I enable Prediction Explanations?

If you can't Include Prediction Explanations, it is likely because:

  • The model's validation partition doesn't contain the required number of rows.

  • For a Combined Model, at least one segment champion validation partition doesn't contain the required number of rows. To enable Prediction Explanations, manually replace retrained champions before creating a model package or deployment.

チャンクサイズとは?

バッチ予測プロセスでは、データが小さな断片に分割され、それらの断片が1つずつスコアリングされるため、DataRobotは大量のバッチをスコアリングできます。 チャンクサイズの設定では、DataRobotがデータをチャンク化するために使用する方法を決定します。 DataRobotは、全体的に最もパフォーマンスが高いデフォルト設定の自動チャンク化をお勧めしますが、他のオプションも利用できます。

  • 固定:DataRobotは、最初に有効なチャンクサイズを識別し、モデルのスコアリングプロセスの残りの部分でそのサイズを引き続き使用します。

  • 動的:DataRobotは、モデルのスコアリング速度が許容範囲内である間はチャンクサイズを大きくし、スコアリング速度が低下するとチャンクサイズを小さくします。

  • カスタム:データサイエンティストがチャンクサイズを設定すると、DataRobotは残りのモデルスコアリングプロセスでそのチャンクサイズを使用し続けます。

時系列オプションの設定

Dataset requirements for time series batch predictions

DataRobotで時系列データを処理するには、以下の要件を満たすようにデータセットを設定します。

  • 予測行をタイムスタンプでソートします。最も古い行が最初に表示されます。
  • 複数系列では、予測行を系列ID、タイムスタンプの順にソートします。
  • DataRobotがサポートする系列の数には制限はありません制限に記載されているように、唯一の制限はジョブのタイムアウトです。

For dataset examples, see the requirements for the scoring dataset.

時系列オプション時系列予測法を設定するには、 予測ポイントまたは予測範囲を選択します。

予測ポイントを使用して、予測を開始する特定の日付を選択します。Then select a Forecast point selection method

  • 自動を選択すると、DataRobotはスコアリングデータに基づいて予測ポイントを選択します。

  • 相対:スケジュールされた予測ジョブの開始時刻を基準にして、予測ポイントを設定します。 次に、オフセットを設定します。 スケジュールされたジョブ実行時間からオフセットする時間およびの数を選択します。 オフセットの適用方法に応じて、ジョブの時間前またはジョブの時間後をクリックします。

  • 手動を選択すると、予測ポイントの日付を選択できます。

一括の過去の予測を行う場合(予測ポイントから将来の行を予測する代わりに)、予測範囲を選択します。 次に、予測範囲を選択します。

  • 予測ソースにあるすべての日付を使用:予測は選択した時間範囲内のすべての予測距離を使用します。

  • 特定の日付範囲を使用:日付セレクターを使用して特定の日付範囲を設定します。

予測先の設定

予測先(別名出力アダプター)を選択します。

宛先タイプに応じた適切な認証ワークフローを完了させます。

宛先の接続タイプ

以下の接続タイプを選択すると、フィールドの説明が表示されます。

備考

接続の参照時に無効なアダプターは表示されません。

データベース接続

クラウドストレージ接続

データウェアハウス接続

その他

予測ジョブのスケジュール

予測ジョブは、スケジュールに従って自動的に実行されるように設定することができます。 ジョブ定義を作成する際に、ジョブスケジュールをオンに切り替えます。 頻度(毎日、毎時、毎月など)と時間帯を指定して、ジョブの実行スケジュールを定義します。

さらに詳細な指定をする場合は、高度なスケジューラーを使用するを選択します。 予測ジョブの実行時刻を分単位で正確に指定することができます。

適切なオプションをすべて設定したら、予測ジョブ定義を保存をクリックします。

予測ジョブ定義の管理

ジョブ定義を表示および管理するには、デプロイタブでデプロイを選択し、予測 > ジョブ定義タブに移動します。

ジョブ定義のアクションメニューをクリックして、以下に説明するアクションの1つを選択します。

要素 説明
ジョブ履歴を表示 デプロイ > 予測ジョブタブを表示し、ジョブ定義から生成されたすべての予測ジョブを一覧表示します。
今すぐ実行 ジョブ定義をすぐに実行します。 進捗を確認するには、デプロイ > 予測ジョブタブに移動します。
定義を編集 ジョブ定義を表示して、更新および保存できるようにします。
定義の無効化 ジョブ定義を一時停止します。 ジョブ定義からスケジュールされたバッチ実行はすべて中断されます。 ジョブ定義のアクションメニューから、定義の無効化をクリックします。 定義の無効化を選択すると、メニュー項目が定義の有効化になります。 定義の有効化をクリックすると、このジョブ定義からのバッチ実行を再度有効にできます。
定義のクローン 既存のジョブ定義から値を取り込んで、新しいジョブ定義を作成します。 既存のジョブ定義のアクションメニューから、定義のクローンをクリックし、必要に応じてフィールドの内容を更新して、予測ジョブ定義を保存をクリックします。 ジョブスケジュール設定はデフォルトでオフになっていることに注意してください。
定義を削除 ジョブ定義を削除します。 定義を削除をクリックし、確認ウィンドウでもう一度定義を削除をクリックします。 スケジュールされたすべてのジョブがキャンセルされます。

予測ジョブの管理

予測ジョブを表示するには、デプロイ > 予測ジョブに移動します。 現在実行されているか、完了したすべてのジョブを表示できます。 デプロイで行われたすべての予測が、このページに表示されます。 ステータス、タイプ、開始時刻と終了時刻、デプロイ、ジョブ定義ID、ジョブID、予測環境でジョブをフィルターします。

予測ジョブリストに表示される情報を以下の表に示します。

カテゴリー 説明
ジョブ定義 予測ジョブの作成に使用するジョブ定義。
ジョブタイプ Specifies the type of job—Make Predictions, Scheduled Run, Manual Run, Integration, Ad hoc API, Insights, Portable, and Challengers.
キューに追加済み 予測ジョブが初期化された時刻。
作成者 ジョブをトリガーしたユーザー。
ステータス ジョブの状態
ソース この予測ジョブの入力アダプター
宛先 この予測ジョブの出力アダプター

予測ジョブを管理するには、右側のアクションメニューから以下のいずれかを選択します。

要素 定義 使用するタイミング
ログを表示 進行中のログが表示され、ログをクリップボードにコピーできます。 ストリーミング入力を使用しないジョブ
再実行 実行をやり直します。 実行が終了したジョブ
デプロイに移動 デプロイの概要タブを開きます。 すべてのジョブ(正常に完了、中止、実行中)
ジョブ定義を編集 予測ジョブ定義の編集タブを開きます。 ジョブ定義を更新して保存します。 すべてのジョブ
ジョブ定義を作成 既存の予測ジョブから設定を取り込んで、新しいジョブ定義を作成します。 新しいジョブ定義が表示され、編集および保存が可能です。 (または、ジョブ定義タブでジョブに対して定義のクローンコマンドを選択することもできます。) Any job—except Challenger jobs

予測ジョブのフィルター

予測ジョブをフィルターするには:

  1. 予測ジョブタブでフィルターリンクを選択します。

  2. フィルターを設定して、フィルターを適用をクリックします。 フィールドをリセットするには、フィルターをクリアをクリックします。

    要素 説明
    ステータス フィルターするジョブステータスのタイプを キュー済み実行中成功中止失敗の中から選択します。
    ジョブタイプ フィルターするジョブのタイプを次の中から選択します。
    キューに追加済み 時間範囲 (選択した日付のまたは)でフィルターします。
    デプロイ フィルターするデプロイを選択します。 入力を開始し、ドロップダウンリストからデプロイを選択します。
    ジョブ定義ID 特定のジョブ定義から生成されたジョブでフィルターします。 入力を開始し、ドロップダウンリストからジョブ定義IDを選択します。
    予測ジョブID 特定の予測ジョブIDを入力します。
    予測環境 設定済みの予測環境から選択します。

更新しました March 6, 2023
Back to top