Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

精度

精度タブでは、標準的な統計的手法とエクスポート可能な可視化によって、時間の経過に伴うモデルデプロイのパフォーマンスを分析できます。 このツールを使用して、モデルの品質が低下しているかどうかや、モデルの置換を検討すべきかどうかを判断します。 モニタリング > 精度タブには、問題のタイプとそれに関連する最適化指標に基づくインサイトが表示されます。

処理制限

このタブに表示される精度スコアは推定値であり、元のデータのすべての予測行を使用して計算された精度スコアとは異なる場合があります。 これは、データ処理に限界があるためです。 処理制限は、組織の 設定に応じて、1時間単位、1日単位、または1週間単位で設定できます。 さらに、1時間あたりのメガバイト制限(通常は100MB/時間)がシステムレベルで定義されます。 精度スコアには、大規模な予測リクエストのすべての行が反映されるわけではないため、より正確なスコアを得るためには、計算の限界に達しないように、複数の時間または日にわたってリクエストを行います。

[精度]タブの有効化

デフォルトでは、精度タブはデプロイに対して有効ではありません。 有効にするには、ターゲットの監視を有効にし、関連付けIDを設定して、DataRobotの外部で収集されたデプロイの予測値と実測値を含むデータをアップロードします。 詳細については、実測値を追加してデプロイの精度を設定する方法の概要を参照してください。

以下のエラーは、精度分析の妨げになる可能性があります。

問題 単位
ターゲットの監視設定が無効になっています 設定 > データドリフトタブでターゲットの監視を有効にします精度タブに、ターゲットの監視を有効にするよう促すメッセージが表示されます。
予測時に関連付けIDがありません 予測を精度追跡に含めるには、予測を行う関連付けIDを設定します。
欠損実測値 設定 > 精度 タブから実測値を追加します。
精度分析を有効にするには、予測数が不十分です 設定 > 精度 タブから実測値を追加します。 精度 タブを有効にするには、対応する実測値を持つ最小100行の予測が必要です。
選択した時間範囲のデータがありません 予測値と実測値が選択した時間範囲と一致することを確認して、その範囲の精度指標を参照します。

精度ダッシュボードを設定

コントロール(モデルバージョンおよびデータ時間範囲セレクター)は、データドリフトタブのコントロールと同様に機能します。 精度タブはセグメント化された分析にも対応しており、個々のセグメント属性や値の精度を確認することができます。

備考

精度ステータスに関するEメール通知を受信するには、通知の設定精度監視の設定を行います。

精度指標の設定

デプロイオーナー は各デプロイに複数の精度指標を設定できます。 デプロイで使用される精度指標は、精度グラフの上に個別のタイルとして表示されます。 使用する指標を編集するには、タイルをカスタマイズを選択します。

ダイアログボックスには、デプロイに対して現在有効になっているすべての指標が一覧表示されます。指標は、左から右方向のタイルの表示順で上から下に表示されます。 最初の指標であるデフォルト指標は、ページを開くと読み込まれます。

アイコン アクション 説明
指標を上に移動 指標グリッドで、指標を左(または上)に移動します。
指標を下に移動 指標グリッドで、指標を右(または下)に移動します。
指標を削除 指標グリッドから指標を削除します。
別の指標を追加 新しい指標を指標リストまたはグリッドの末尾に追加します。

1つのデプロイで、最大10の精度タイルを表示できます。 指標が不足している場合、既存のタイルの精度指標を変更します。変更する指標のドロップダウンをクリックして、置き換える指標を選択します。 利用可能な指標は、デプロイに使用するモデリングプロジェクトのタイプ(連続値、二値分類または多クラス)によって異なります。

モデリングタイプ 利用可能な指標
連続値 RMSE、MAE、Gamma Deviance、Tweedie Deviance、R Squared、FVE Gamma、FVE Poisson、FVE Tweedie、Poisson Deviance、MAD、MAPE、RMSLE
二値分類 LogLoss、AUC、Kolmogorov-Smirnov、Gini-Norm、Rate@Top10%、Rate@Top5%、TNR、TPR、FPR、PPV、NPV、F1、MCC、Accuracy、Balanced Accuracy、FVE Binomial
多クラス LogLoss、FVE多項式

備考

これらの指標の詳細については、 最適化指標のドキュメントを参照してください。

すべての変更を行ったら、OKをクリックします。 精度タブが更新され、表示中の指標に加えた変更が反映されます。

精度チャートの分析

これらの精度のインサイトは、問題のタイプとそれに関連する最適化指標に基づいてレンダリングされます。 特に、時系列の精度チャートには、 選択した精度指標の経時変化が表示されます。 時系列の精度チャートと予測値と実測値チャートは、1つで2つのチャートであり、共通のx軸である予測時間を共有します。

予測の時間

予測の時間の値は、データドリフトタブと精度タブ、およびサービスの正常性タブで異なります。

  • [サービスの正常性]タブの「予測リクエストの日時」は、常に予測サーバーが予測リクエストを受信した日時です。 この予測リクエストの追跡方法は、診断目的で予測サービスの正常性を正確に示しています。

  • データドリフトタブと精度タブについてデフォルトで、「予測リクエストの時間」は、予測リクエストを送信した時刻になります。これは、 予測履歴とサービスの正常性設定で、予測タイムスタンプでオーバーライドできます。

予測時間軸(x軸)では、各ポイントで作成された予測に関連付けられた実測値の数が、ボリュームビンに表示されます。 影付きの領域はアップロードされた実測値の数を表し、縞模様の領域は対応する実測値が欠損している予測の数を表します。

時系列デプロイでの予測の時間

時系列デプロイのデフォルトの予測タイムスタンプ方法は、予測リクエストの時刻ではなく、予測日(つまり、予測ポイント+予測距離)です。 予測日では、トレーニングデータとデータドリフトおよび精度統計の基準との間で共通の時間軸を使用できます。 たとえば、予測日を使用して、予測データの日付が6月1日から6月10日で、予測ポイントが6月10日に設定され、予測距離が+1 - + 7日に設定されている場合、6月11日~17日の予測値を入手でき、データドリフトもこの期間追跡されます。

モデルをデプロイする際に、以下の予測スタンプオプションから選択できます。

  • 日付/時刻特徴量の値を使用デフォルト。 予測データと共に特徴量として提供される日時(例:予測日)を使用して、タイムスタンプを決定します。
  • 予測リクエストの時刻を使用:予測リクエストを送信した日時を使用して、タイムスタンプを決定します。

いずれかのチャートで、プロット上のマーカー(またはマーカーに関連付けられた周囲のビン)をポイントすると、そのデータポイントの特定の詳細が表示されます。 次の表は、連続値モデルと分類モデルの両方のデプロイで提供される情報を示します。

要素 連続値 分類
1 ポイントがキャプチャする期間。
2 ポイントの期間に対して選択した最適化指標値。 これにはグラフ上の対応する指標タイルのスコアが反映され、表示された期間に合わせて調整されます。
3 ポイントの期間の平均予測値(予測データから派生)。 値は、予測値と実測値のグラフに沿った青いポイントとして反映されます。 ポイントの期間に対して予測データで値ラベル(trueまたはfalse)が予測された頻度(パーセンテージ)。 値は、予測値と実測値のグラフに沿った青いポイントとして表されます。 ラベルの設定については、下の画像を参照してください。
4 ポイントの期間の平均実測値(実測データから派生)。 値は予測値と実測値のグラフに沿ったオレンジのポイントで反映されます。 ポイントの期間に対して実測値データが値1(true)である頻度(パーセンテージ)。 これらの値は、予測値と実測値のグラフに沿ってオレンジのポイントとして表されます。 ラベルの設定については、下の画像を参照してください。
5 チャート上のこのポイントで表示される行数。
6 対応する実測値が記録されていない予測行数。 この値は、選択したポイントに固有のものではありません。

時系列の精度(AOT)チャート

時系列の精度グラフには、選択した精度指標の値の経時変化が表示されます。 グラフの上にある指標タイルをクリックすると、表示が変更されます。

開始値(ベースライン精度スコア)とプロットされた精度ベースラインは、モデルの精度スコアを表します。これは、トレーニングされたモデルのホールドアウトパーティションでの予測を使用して計算されます。

カスタムモデルのホールドアウトパーティション

予測値と実測値の比較チャート

予測値と実測値のチャートには、時間の経過に伴う予測値と実測値が表示されます。 二値分類プロジェクトの場合、チャートの上部にあるドロップダウンメニューから、表示する分類値(この例ではTrueまたはFalse)を選択できます。

実測値が欠損している予測を識別するには、実測値が欠損しているIDのダウンロードリンクをクリックします。 実測値が欠損している予測をリストしたCSVファイル(missing_actuals.csv)が各予測の関連付けIDとともにダウンロードされます。 関連付けIDを使用して、一致するIDを持つ実測値をアップロードします。

多クラス精度チャート

多クラスデプロイでは、標準のデプロイと同じ時系列の精度予測値と実測値の比較チャートが提供されますが、チャートには個々のクラスが含まれ、表示されるデータを定義するクラスベースの設定が提供されるため、チャートは若干異なります。 さらに、データを チャートとして表示するか、 テーブルとして表示するかを選択することができます。

備考

デフォルトでは、チャートにはトレーニングデータで最も一般的な5つのクラスが表示されます。クラスの数が5を超えると、他のすべてのクラスは1行で表されます。

表示されるクラスを設定するには、日付スライダー上で、ターゲットクラスドロップダウンを設定し、選択したタブに表示するクラスを制御します。

ドロップダウンをクリックして表示するクラスを決定し、以下のいずれかを選択します。

オプション 説明
すべてのクラスを使用する トレーニングデータで最も一般的な5つのクラスをすべて選択し、他のすべてのクラスを表す1つのラインを表示します。
特定のクラスを選択する 最大5つのクラスを表示するには、次のいずれかを実行します。
  • 後続のフィールドに表示したいクラス名を入力します。
  • ショートカットを選択します:トレーニングで最も一般的最も精度が低い、または最もドリフトされた

適用をクリックすると、タブのチャートが更新され、選択したクラスが表示されます。

Accuracy over space chart

プレビュー

Geospatial feature monitoring is on by default and supported for binary classification, multiclass, and regression target types.

Feature flags: Enable Geospatial Features Monitoring, Enable Geospatial Features in Workbench

When DataRobot Location AI detects and ingests geospatial features, DataRobot uses H3 indexing and segmented analysis to segment the world into a grid of cells. On the Accuracy tab, these cells serve as the foundation for "accuracy over space" analysis, allowing you to identify changes in accuracy for each location cell, in addition to the difference in sample size between training data baseline calculation and the scoring data.

To access the Accuracy over space chart, in a deployment configured for accuracy over space analysis, click Over space to switch the Accuracy over time chart to accuracy over space mode.

Enable geospatial monitoring for a deployment

For a deployed binary classification, regression, or multiclass model built with location data in the training dataset, you can leverage DataRobot Location AI to perform geospatial monitoring for the deployment. デプロイで地理空間分析を有効にするには、セグメント化された分析を有効化し、位置データの取込み中に生成される位置特徴量geometryのセグメントを定義します。 The geometry segment contains the identifier used to segment the world into a grid of—typically hexagonal—cells, known as H3 cells.

Defining the location segment

You do not have to use geometry as the segment value if you provide a column containing the H3 cell identifiers required for geospatial monitoring. The column provided as a segment value can have any name, as long as it contains the required identifiers (described below).

Location AI supports ingest of these native geospatial data formats:

  • ESRIシェープファイル
  • GeoJSON
  • ESRIファイルジオデータベース
  • Well Known Text(テーブルの列に埋め込み)
  • PostGISデータベース

In addition to native geospatial data ingest, location AI can automatically detect location data within non-geospatial formats by recognizing location variables when columns in the dataset are named latitude and longitude and contain values in these formats:

  • 小数度
  • 度分秒
    • -46° 37′ 59.988″ および -23° 33′
    • 46.63333W および 23.55S
    • 46*37′59.98"W および 23*33′S
    • W 46D 37m 59.988s および S 23D 33m

When location AI recognizes location features, the location data is aggregated using H3 indexing to group locations into cells. Cells are represented by a 64-bit integer described in hexadecimal format (for example, 852a3067fffffff). As a result, locations that are close together are often grouped in the same cell. These hexadecimal values are stored in the geometry feature.

The size of the resulting cells is determined by a resolution parameter, where a higher resolution value represents more cells generated. The resolution is calculated during training data baseline generation and is stored for use in deployment monitoring.

When making predictions, each prediction row should contain the required location feature alongside the other prediction rows.

Analyze the accuracy over space chart

If a deployment is configured for accuracy over space analysis, click Over space to switch the Accuracy over time chart to the Accuracy over space chart.

To configure the Metric represented in the Drift over space chart, click the Metric: drop-down menu and select one of the following options:

指標 説明
精度指標
Selected metric The calculated accuracy metric for the predictions in the cell. Click the metric tile above the Drift over space chart to select a metric for the chart. The available metrics depend on the modeling/target type:
  • Regression: RMSE, MAE, Gamma Deviance, Tweedie Deviance, R Squared, FVE Gamma, FVE Poisson, FVE Tweedie, Poisson Deviance, MAD, MAPE, RMSLE
  • Binary classification: LogLoss, AUC, Kolmogorov-Smirnov, Gini-Norm, Rate@Top10%, Rate@Top5%, TNR, TPR, FPR, PPV, NPV, F1, MCC, Accuracy, Balanced Accuracy, FVE Binomial
  • Multiclass: LogLoss, FVE Multinomial
For more information on these metrics, see the optimization metrics documentation.
サンプルサイズ
スコアリングデータの行数 The sample size contained in the cell for the scoring dataset.
トレーニングデータの行数 The sample size contained in the cell for the training dataset used for training baseline generation.
実測値のある行の数 The number of prediction rows paired with an actual value for the cell.
予測値対実測値
平均予測値 For regression deployments, the mean predicted value for the cell.
パーセンテージ予測値 For binary and multiclass deployments, the percentage of the predicted values in the cell classified as the selected class.
平均実測値 For regression deployments, the mean actual value for the cell.
パーセンテージ実測値 For binary and multiclass deployments, the percentage of the actual values in the cell classified as the selected class.

To interact with the Drift over space chart display, use the following actions:

指標 説明
1 Zoom settings:
  • : Zoom In
  • : Zoom Out
  • : Reset
2 Map/mouse actions:
  • Point to a cell to view details of the predictions grouped in that cell.
  • Click a cell to copy the cell contents.
  • Double click or scroll up and down on the map to zoom in and out.
  • Click and drag to move the map view.
3 Click the settings icon to adjust the Opacity of the cells.
4 Click Map legend to open and close the legend outlining the range of values to which certain cell shades correspond.

精度アラートの解釈

DataRobotは、デプロイのために選択された最適化指標タイルを精度スコアとして使用し、アラートステータスを作成します。 アラートステータスの意味を以下に示します。

精度 アクション
緑 / 合格 精度はモデルがデプロイされたときとほぼ同じです。 必要なアクションはありません。
黄色 / リスクあり 精度はモデルが展開されたときから低下しています。 懸念がありますが、早急のアクションは必要ありません。監視を継続してください。
赤 / 失敗 精度はモデルが展開されたときから大幅に低下しています。 早急なアクションが必要です。
グレー / 無効 Accuracy tracking is disabled. 監視を有効にして、予測を行います。
グレー / 開始されていない 精度追跡はまだ開始されていません。 予測の作成。
グレー/不明 精度データがありません。 An insufficient number of predictions have been made (minimum 100 required). 予測の作成。

更新しました January 8, 2025