Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

「データのエクスポート」タブ

You can export a deployment's stored training data, prediction data, and actuals to compute and monitor custom business or performance metrics on the Custom Metrics tab or outside DataRobot. カスタム指標のためにデプロイデータをエクスポートするには、デプロイに予測データが保存されていることを確認し、指定された時間範囲のデータを生成して、そのデータを表示またはダウンロードします。

To access deployment data export:

  1. 上部のナビゲーションバーで、デプロイをクリックします。

  2. On the Deployments tab, click on the deployment from which you want to access stored training data, prediction data, or actuals.

    備考

    [データのエクスポート]タブにアクセスするには、デプロイに予測データを保存する必要があります。 デプロイの設定で、チャレンジャーモデルの分析で予測行ごとの履歴保存を有効化していることを確認します。

  3. デプロイで、データエクスポートタブをクリックします。

Access or download data

予測データ、トレーニングデータ、または実測値にアクセスまたはダウンロードするには:

  1. 以下の設定を行い、エクスポートする保存済みトレーニングデータ、予測データ、または実測値を指定します。

    設定 説明
    モデル 予測データをエクスポートするデプロイのモデル(現在または以前)を選択します。
    範囲 (UTC) 予測データをエクスポートする期間の開始日と終了日を選択します。
    単位 日付スライダーの時間単位を選択します。 選択した時間範囲に基づき、単位を毎時、毎日、毎週、毎月から選択します。 時間範囲が7日を超える場合、単位を毎時にすることはできません。
    リセット データのエクスポート設定をデフォルトに戻します。
  2. トレーニングデータ予測データ実測値の各パネルで:

    • Click Generate Training Data to generate training data for the specified time range.

    • Click Generate Prediction Data to generate prediction data for the specified time range.

    • Click Generate Actuals to generate actuals for the specified time range.

    予測データと実測値に関する注意事項

    When generating prediction data or actuals, consider the following:

    • 予測データの生成時にエクスポート可能な行数は、1回のエクスポートで最大20万行までです。 設定した時間範囲で予測データが20万行を超える場合は、範囲を縮小してください。

    • AIカタログで持つことができる予測エクスポート項目は、最大で100個までです。 エクスポート用の予測データを生成すると、AIカタログの予測エクスポート項目の数がその制限を超える場合は、AIカタログで古い予測エクスポート項目を削除してください。

    • 時系列デプロイで予測データを生成する場合、2つの予測エクスポート項目がAIカタログに追加されます。 1つは予測データ用、もう1つは予測結果用です。 [データのエクスポート]タブは予測結果にリンクしています。

    • 実測値データの生成時にエクスポート可能な行数は、最大で20万行までです。 設定した時間範囲で実測値が100万行を超える場合は、時間範囲を縮小してください。

    • AIカタログでは、実測値のエクスポート項目は最大100個まで可能です。 If generating actuals data for export would cause the number of actuals export items in the AI Catalog to exceed that limit, delete old actuals export AI Catalog items.

    • Up to 10,000,000 actuals are stored for a deployment; therefore, exporting old actuals can result in an error if no actuals are currently stored for that time period.

    The training data appears in the Training Data panel. Prediction data and actuals appear in the table below, identified by Prediction Data or Actuals in the Type column.

  3. After the prediction data, training data, or actuals are generated:

    • オープンアイコン をクリックすると、AIカタログに予測データが開かれます。

    • ダウンロードアイコン をクリックすると、予測データがダウンロードされます。

備考

You can also click Use data in Notebook to open a DataRobot notebook with cells for exporting training data, prediction data, and actuals.

エクスポートされたデプロイデータをカスタム指標に使用

エクスポートされたデプロイデータを使用して独自のカスタム指標を作成するには、エクスポートされたデータを含むCSVファイルから読み取り、エクスポートプロセスで自動的に生成された列を含む結果の値を使用して指標を計算するスクリプトを実行します。

この例では、エクスポートされた予測データを使い、DataRobotの予測タイムスタンプ(DR_RESERVED_PREDICTION_TIMESTAMP)をDateFrameインデックス(または行ラベル)として、30日間のtime_in_hospital特徴量の変化を計算およびプロットしています。 また、エクスポートされたトレーニングデータをプロットのベースラインとして使用します。

import pandas as pd
feature_name = "<numeric_feature_name>"
training_df = pd.read_csv("<path_to_training_data_csv>")
baseline = training_df[feature_name].mean()
prediction_df = pd.read_csv("<path_to_prediction_data_csv>")
prediction_df["DR_RESERVED_PREDICTION_TIMESTAMP"] = pd.to_datetime(
    prediction_df["DR_RESERVED_PREDICTION_TIMESTAMP"]
)
predictions = prediction_df.set_index("DR_RESERVED_PREDICTION_TIMESTAMP")["time_in_hospital"]
ax = predictions.rolling('30D').mean().plot()
ax.axhline(y=baseline - 2, color="C1", label="training data baseline")
ax.legend()
ax.figure.savefig("feature_over_time.png") 

DataRobotの列参照

DataRobot は、エクスポート用に生成された予測データに、以下の列を自動的に追加します。

説明
DR_RESERVED_PREDICTION_TIMESTAMP 予測のタイムスタンプが格納されます。
DR_RESERVED_PREDICTION 連続値の予測値を示します。
DR_RESERVED_PREDICTION_<Label> 分類の予測値を示します。

更新しました April 19, 2023
Back to top