Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

1回限りのバッチ予測を行う

デプロイ > 予測を作成タブを使用して、バッチ予測を作成してデプロイ済みモデルによってデータセットを効率的にスコアリングします。

備考

デプロイする前のモデルの予測の場合、リーダーボードから選択し、予測 > 予測を作成に移動します。

バッチ予測とは、大規模なデータセットで予測を作成する方法で、入力データを渡すと各行の予測結果が得られます。 DataRobotは、これらの予測を出力ファイルに書き出します。 以下を行うこともできます。

予測ソースの選択

デプロイされたモデルでバッチ予測を行うには、デプロイの予測 > 予測を作成タブに移動し、予測ソースをアップロードします。

  • ファイルをクリックして、予測ソースグループボックスにドラッグします。

  • ファイルを選択をクリックして、ローカルファイルまたはAIカタログ**に保存されているデータセットをアップロードします。

備考

予測データセットをアップロードすると、完全にアップロードされた後にAIカタログに自動的に保存されます。 アップロードが完了する前にページから移動しないようにしてください。そうしないと、データセットがカタログに保存されません。 アップロードした後まだデータセットが処理中の場合、使用可能になる前にDataRobotがEDAを実行します。

デプロイでの予測の作成

このセクションでは、予測を作成タブを使用して、標準的なデプロイと時系列デプロイでバッチ予測を行う方法を説明します。

フィールド名 説明
1 予測データセット ローカルファイルをアップロードするか、AIカタログからデータセットをインポートして、予測ソースを選択します。
2 時系列オプション 時系列予測の方法‭を指定および設定します。
3 予測オプション 予測オプションを設定します
4 予測を計算およびダウンロード データをスコアリングし、予測をダウンロードします
5 最近の予測をダウンロード 最近のバッチ予測を表示し、結果をダウンロードします。 予測のダウンロードは48時間有効です。

時系列オプションの設定

時系列データ要件

時系列モデルで予測を作成するには、特定の形式のデータセットが必要です。 形式は時系列プロジェクトの設定に基づきます。 予測データセットに正しい履歴行、予測行、および事前に既知の特徴量が含まれていることを確認します。 さらに、DataRobotが時系列データを確実に処理できるようにするには、次の要件を満たすようにデータセットを設定してください。

  • 予測行をタイムスタンプでソートします。最も古い行が最初に表示されます。
  • 複数系列では、予測行を系列IDでソートし、さらにタイムスタンプでソートして、古い順に表示します。

DataRobotがサポートする系列の数には制限はありません制限に記載されているように、唯一の制限はジョブのタイムアウトです。 データセットの例については、スコアリングデータセットの要件をご覧ください。

時系列オプションを設定するには、時系列予測法予測ポイント設定を定義します。

  • 自動的に設定:DataRobotは、スコアリングデータに基づいて、予測ポイントを自動的に設定します(通常は、可能な限り最新の日付タイムスタンプが、有効な予測ポイントです)。

  • 手動で設定:日付セレクターを使用して開始および終了の日付を手動で指定し、特定の日付範囲を設定します。

さらに、高度なオプションを表示をクリックし、事前に既知の列の欠損値を無視するを有効にすると、指定されたソースデータセットの事前に既知の列で欠損値があっても、予測を行うことができます。ただし、これは計算された予測に悪影響を及ぼす可能性があります。

予測オプションの設定

ファイルがアップロードされたら、予測オプションを設定します。 (Optional) You can click Show advanced options to configure additional options.

要素 説明
1 予測結果に追加の特徴量値を含める 予測値と一緒に入力特徴量を予測結果ファイルに書き込みます。 To add specific features, enable the Include additional feature values in prediction results toggle, select Add specified features, and type feature names to filter for and then select features. データセットのすべての特徴量を含めるには、すべての特徴量を追加を選択します。 追加できるのは元のデータセットに存在する特徴量(列)だけですが、その特徴量は、モデルの構築に使用した特徴量セットの一部である必要はありません。 派生した特徴量は含まれません
2 予測の説明を含める 予測の出力結果に 予測の説明のための列を追加します。
  • 説明数:デプロイ済みモデルにリクエストする説明の最大数を入力します。 予測リクエストごとに、100の説明をリクエストできます。
  • 予測のしきい値(低):このしきい値を有効化して定義し、設定したしきい値を下回るいずれかのの予測の説明を提供します。
  • 予測のしきい値(高):このしきい値を有効化して定義し、設定したしきい値を上回るいずれかのの予測の説明を提供します。
  • N-gramの説明数:データセットの行ごとに返すテキスト ngramの説明の最大数を有効にして定義します。 デフォルト(および推奨)設定は、すべて(制限なし)です。
予測の説明を有効にできない場合は、 予測の説明を有効にできない理由を参照してください。
3 予測外れ値警告を含める 外れ値の予測値に対する警告を含めます(連続値モデルデプロイでのみ使用可能)。
4 予測のためのデータのドリフト、精度、公平性の追跡 データドリフト精度公平性を追跡します(デプロイで有効になっている場合)。
5 チャンクサイズ チャンクサイズの選択方法を調整します。 デフォルトでは、チャンクサイズは自動的に計算されます。この設定は、DataRobotの担当者から勧められた場合にのみ変更してください。 詳細については、チャンクサイズとは?を参照してください。
6 予測リクエストの同時実行 予測リクエストの同時実行数を制限します。 デフォルトでは、予測ジョブは利用可能な予測サーバーコアをすべて使用します。 リアルタイム予測用に処理能力を確保するには、同時予測リクエストの最大数に上限を設けます。
7 予測ステータスを含める 予測のステータスを含む列を追加します。
8 デフォルトの予測インスタンスを使用 予測インスタンスを変更できます。 トグルをオフにして、予測インスタンスを選択します。
9 列名の再マッピング Change column names in the prediction job's output by mapping them to entries added in this field. Click + Add column name remapping and define the Input column name to replace with the specified Output column name in the prediction output. If you incorrectly add a column name mapping, you can click the delete icon to remove it.
予測の説明を有効にできないのはなぜですか?

予測の説明を含めることができない場合、次の理由が考えられます。

  • モデルの検定パーティションに、必要な行数が含まれていません。

  • 統合されたモデルで、少なくとも1つのセグメントチャンピオンの検定パーティションに、必要な行数が含まれていません。 予測の説明を有効にするには、モデルパッケージやデプロイを作成する前に、再トレーニングしたチャンピオンを手動で置き換えてください。

チャンクサイズとは?

バッチ予測プロセスでは、データが小さな断片に分割され、それらの断片が1つずつスコアリングされるため、DataRobotは大量のバッチをスコアリングできます。 チャンクサイズの設定では、DataRobotがデータをチャンク化するために使用する方法を決定します。 DataRobotは、全体的に最もパフォーマンスが高いデフォルト設定の自動チャンク化をお勧めしますが、他のオプションも利用できます。

  • 固定:DataRobotは、最初に有効なチャンクサイズを識別し、モデルのスコアリングプロセスの残りの部分でそのサイズを引き続き使用します。

  • 動的:DataRobotは、モデルのスコアリング速度が許容範囲内である間はチャンクサイズを大きくし、スコアリング速度が低下するとチャンクサイズを小さくします。

  • カスタム:データサイエンティストがチャンクサイズを設定すると、DataRobotは残りのモデルスコアリングプロセスでそのチャンクサイズを使用し続けます。

予測を計算およびダウンロード

After you configure predictions settings and click Compute and download predictions to score the data, wait for the prediction job to complete. You can perform the following actions on completed prediction jobs:

アイコン アクション
For time series predictions, view the Forecast visualization.
Download the predictions file.
Access logs to view and optionally copy the prediction job run details.

Predictions are available for download on the Predictions > Make Predictions tab for the next 48 hours. You can also view and download predictions and logs on the Deployments > Batch Jobs tab.

バッチ予測ジョブのキャンセル

Click the stop icon while the job is running to cancel it. For canceled or failed jobs, click the logs icon to view the logs for the job.


更新しました February 20, 2024