データ探索タブ¶
デプロイの保存されたトレーニングデータ、予測データ、および実測値をエクスポートして、 カスタム指標タブで、またはDataRobotの外部で、カスタムビジネスまたはパフォーマンス指標を計算し監視します。 カスタム指標のためにデプロイデータをエクスポートするには、デプロイに予測データが保存されていることを確認し、指定された時間範囲のデータを生成して、そのデータを表示またはダウンロードします。
デプロイデータのエクスポートにアクセスするには:
-
上部のナビゲーションバーで、デプロイをクリックします。
-
デプロイタブで、保存されたトレーニングデータ、予測データ、または実測値にアクセスするデプロイをクリックします。
備考
[データ探索]タブにアクセスするには、デプロイに予測データを保存する必要があります。 デプロイの設定で、チャレンジャーモデルの分析で予測行ごとの履歴保存を有効化していることを確認します。 [データ探索]タブでは、予測でリクエストされた場合でも、予測の説明は保存またはエクスポートされません。
-
デプロイで、データ探索タブをクリックします。
データへのアクセスまたはデータのダウンロード¶
予測データ、トレーニングデータ、または実測値にアクセスまたはダウンロードするには:
-
以下の設定を行い、エクスポートする保存済みトレーニングデータ、予測データ、または実測値を指定します。
設定 説明 1 モデル 予測データをエクスポートするデプロイのモデル(現在または以前)を選択します。 2 範囲 (UTC) 予測データをエクスポートする期間の開始日と終了日を選択します。 3 単位 日付スライダーの時間単位を選択します。 選択した時間範囲に基づき、単位を毎時、毎日、毎週、毎月から選択します。 時間範囲が7日を超える場合、単位を毎時にすることはできません。 4 リセット データのエクスポート設定をデフォルトに戻します。 -
トレーニングデータ、予測データ、実測値の各パネルで:
-
トレーニングデータを生成をクリックして、指定したモデルと時間範囲のトレーニングデータを生成します。
-
予測データを生成をクリックして、指定したモデルと時間範囲の予測データを生成します。
-
実測値を生成をクリックして、指定したモデルと時間範囲の実測値を生成します。
-
カスタム指標のデータを生成をクリックして、指定したモデルと時間範囲で使用可能なカスタム指標データを生成します。
本機能の提供について
カスタム指標データのエクスポートは、デフォルトではオフになっています。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。
機能フラグ:テキスト生成のターゲットタイプでデータ品質テーブルを有効にする(プレミアム機能)、生成モデルで実測値の保存を有効にする(プレミアム機能)
予測データと実測値に関する注意事項
予測データまたは実測値を生成するときは、以下の点を考慮してください。
-
予測データの生成時にエクスポート可能な行数は、1回のエクスポートで最大20万行までです。 設定した時間範囲で予測データが20万行を超える場合は、範囲を縮小してください。
-
AIカタログで持つことができる予測エクスポート項目は、最大で100個までです。 エクスポート用の予測データを生成すると、AIカタログの予測エクスポート項目の数がその制限を超える場合は、AIカタログで古い予測エクスポート項目を削除してください。
-
時系列デプロイで予測データを生成する場合、2つの予測エクスポート項目がAIカタログに追加されます。 1つは予測データ用、もう1つは予測結果用です。 [データ探索]タブは予測結果にリンクしています。
-
実測値データの生成時にエクスポート可能な行数は、最大で20万行までです。 設定した時間範囲で実測値が100万行を超える場合は、時間範囲を縮小してください。
-
AIカタログでは、実測値のエクスポート項目は最大100個まで可能です。 エクスポートする実測値データを生成することで、AIカタログ内の実測値エクスポートアイテムの数がその制限を超えた場合、古い実測値を削除してAIカタログアイテムをエクスポートします。
-
最大10,000,000の実測値がデプロイ用に保存されます。したがって、その期間に実測値が現在保存されていない場合、古い実測値をエクスポートするとエラーが発生する可能性があります。
トレーニングデータがトレーニングデータパネルに表示されます。 予測データと実測値は以下の表に表示され、タイプ列で予測データまたは実測値により識別されます。
-
-
予測データ、トレーニングデータ、または実測値が生成された後:
-
オープンアイコン をクリックすると、AIカタログに予測データが開かれます。
-
ダウンロードアイコン をクリックすると、予測データがダウンロードされます。
-
備考
ノートブックでデータを使用をクリックして、トレーニングデータ、予測データ、および実測値をエクスポートするためのセルのある DataRobotノートブックを開くこともできます。
エクスポートされたデプロイデータをカスタム指標に使用¶
エクスポートされたデプロイデータを使用して独自のカスタム指標を作成するには、エクスポートされたデータを含むCSVファイルから読み取り、エクスポートプロセスで自動的に生成された列を含む結果の値を使用して指標を計算するスクリプトを実行します。
この例では、エクスポートされた予測データを使い、DataRobotの予測タイムスタンプ(DR_RESERVED_PREDICTION_TIMESTAMP
)をDateFrameインデックス(または行ラベル)として、30日間のtime_in_hospital
特徴量の変化を計算およびプロットしています。 また、エクスポートされたトレーニングデータをプロットのベースラインとして使用します。
import pandas as pd
feature_name = "<numeric_feature_name>"
training_df = pd.read_csv("<path_to_training_data_csv>")
baseline = training_df[feature_name].mean()
prediction_df = pd.read_csv("<path_to_prediction_data_csv>")
prediction_df["DR_RESERVED_PREDICTION_TIMESTAMP"] = pd.to_datetime(
prediction_df["DR_RESERVED_PREDICTION_TIMESTAMP"]
)
predictions = prediction_df.set_index("DR_RESERVED_PREDICTION_TIMESTAMP")["time_in_hospital"]
ax = predictions.rolling('30D').mean().plot()
ax.axhline(y=baseline - 2, color="C1", label="training data baseline")
ax.legend()
ax.figure.savefig("feature_over_time.png")
DataRobotの列参照¶
DataRobot は、エクスポート用に生成された予測データに、以下の列を自動的に追加します。
列 | 説明 |
---|---|
DR_RESERVED_PREDICTION_TIMESTAMP |
予測のタイムスタンプが格納されます。 |
DR_RESERVED_PREDICTION |
連続値の予測値を示します。 |
DR_RESERVED_PREDICTION_<Label> |
分類の予測値を示します。 |