Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

精度

精度タブでは、標準的な統計的手法とエクスポート可能な可視化によって、時間の経過に伴うモデルデプロイのパフォーマンスを分析できます。 このツールを使用して、モデルの品質が低下しているかどうかや、モデルの置換を検討すべきかどうかを判断します。 The Monitoring > Accuracy tab renders insights based on the problem type and its associated optimization metrics.

備考

このタブに表示される精度スコアは推定値であり、元のデータのすべての予測行を使用して計算された精度スコアとは異なる場合があります。 これは、1時間あたりのデータ処理に限界があるためです。 1時間の制限時間内では100,000を超える行を使用して精度スコアを計算できないため、DataRobotは精度を計算できた行に基づいてスコアを提供します。 より正確な精度スコアを達成するには、予測リクエストの期間を数時間に設定し、1時間あたりの計算限界に達しないようにします。

[精度]タブの有効化

デフォルトでは、精度タブはデプロイに対して有効ではありません。 有効にするには、ターゲットの監視を有効にし、関連付けIDを設定して、DataRobotの外部で収集されたデプロイの予測値と実測値を含むデータをアップロードします。 詳細については、実測値を追加してデプロイの精度を設定する方法の概要を参照してください。

以下のエラーは、精度分析の妨げになる可能性があります。

問題 単位
ターゲットの監視設定が無効になっています 設定 > データドリフトタブでターゲットの監視を有効にします精度タブに、ターゲットの監視を有効にするよう促すメッセージが表示されます。
予測時に関連付けIDがありません 予測を精度追跡に含めるには、予測を行う関連付けIDを設定します。
欠損実測値 設定 > 精度 タブから実測値を追加します。
精度分析を有効にするには、予測数が不十分です 設定 > 精度 タブから実測値を追加します。 精度 タブを有効にするには、対応する実測値を持つ最小100行の予測が必要です。
選択した時間範囲のデータがありません 予測値と実測値が選択した時間範囲と一致することを確認して、その範囲の精度指標を参照します。

精度ダッシュボードを設定

コントロール(モデルバージョンおよびデータ時間範囲セレクター)は、データドリフトタブのコントロールと同様に機能します。 精度タブはセグメント化された分析にも対応しており、個々のセグメント属性や値の精度を確認することができます。

備考

精度ステータスに関するEメール通知を受信するには、通知の設定精度監視の設定を行います。

精度指標の設定

デプロイオーナー は各デプロイに複数の精度指標を設定できます。 デプロイで使用される精度指標は、精度グラフの上に個別のタイルとして表示されます。 使用する指標を編集するには、タイルをカスタマイズを選択します。

ダイアログボックスには、デプロイに対して現在有効になっているすべての指標が一覧表示されます。指標は、左から右方向のタイルの表示順で上から下に表示されます。 The first metric, the default metric, loads when you open the page.

アイコン アクション 説明
Move metric up Move the metric to the left (or up) in the metric grid.
Move metric down Move the metric to the right (or down) in the metric grid.
Remove metric Remove the metric from the metric grid.
別の指標を追加 Add a new metric to the end of the metric list/grid.

1つのデプロイで、最大10の精度タイルを表示できます。 If you run out of metrics, change an existing tile's accuracy metric, clicking the dropdown for the metric you wish to change and selecting the metric to replace it. 利用可能な指標は、デプロイに使用するモデリングプロジェクトのタイプ(連続値、二値分類または多クラス)によって異なります。

モデリングタイプ 利用可能な指標
連続値 RMSE、MAE、Gamma Deviance、Tweedie Deviance、R Squared、FVE Gamma、FVE Poisson、FVE Tweedie、Poisson Deviance、MAD、MAPE、RMSLE
二値分類 LogLoss、AUC、Kolmogorov-Smirnov、Gini-Norm、Rate@Top10%、Rate@Top5%、TNR、TPR、FPR、PPV、NPV、F1、MCC、Accuracy、Balanced Accuracy、FVE Binomial
多クラス LogLoss、FVE多項式

備考

これらの指標の詳細については、 最適化指標のドキュメントを参照してください。

すべての変更を行ったら、OKをクリックします。 精度タブが更新され、表示中の指標に加えた変更が反映されます。

Analyze the accuracy charts

これらの精度のインサイトは、問題のタイプとそれに関連する最適化指標に基づいてレンダリングされます。 In particular, the Accuracy over Time chart displays the change in the selected accuracy metric over time. The Accuracy over Time and Predicted & Actual charts are two charts in one, sharing a common x-axis, Time of Prediction.

予測の時間

予測の時間の値は、データドリフトタブと精度タブ、およびサービスの正常性タブで異なります。

  • [サービスの正常性]タブの「予測リクエストの日時」は、常に予測サーバーが予測リクエストを受信した日時です。 この予測リクエストの追跡方法は、診断目的で予測サービスの正常性を正確に示しています。

  • データドリフトタブと精度タブについてデフォルトで、「予測リクエストの時間」は、予測リクエストを送信した時刻になります。これは、 予測履歴設定で、予測タイムスタンプでオーバーライドできます。

On the Time of Prediction axis (the x-axis), the volume bins display the number of actual values associated with the predictions made at each point. 影付きの領域はアップロードされた実測値の数を表し、縞模様の領域は対応する実測値が欠損している予測の数を表します。

On either chart, point to a marker (or the surrounding bin associated with the marker) on the plot to see specific details for that data point. The following table explains the information provided for both regression and classification model deployments:

要素 連続値 分類
1 ポイントがキャプチャする期間。
2 ポイントの期間に対して選択した最適化指標値。 これにはグラフ上の対応する指標タイルのスコアが反映され、表示された期間に合わせて調整されます。
3 ポイントの期間の平均予測値(予測データから派生)。 値は、予測値と実測値のグラフに沿った青いポイントとして反映されます。 ポイントの期間に対して予測データで値ラベル(trueまたはfalse)が予測された頻度(パーセンテージ)。 値は、予測値と実測値のグラフに沿った青いポイントとして表されます。 ラベルの設定については、下の画像を参照してください。
4 ポイントの期間の平均実測値(実測データから派生)。 値は予測値と実測値のグラフに沿ったオレンジのポイントで反映されます。 ポイントの期間に対して実測値データが値1(true)である頻度(パーセンテージ)。 これらの値は、予測値と実測値のグラフに沿ってオレンジのポイントとして表されます。 ラベルの設定については、下の画像を参照してください。
5 チャート上のこのポイントで表示される行数。
6 対応する実測値が記録されていない予測行数。 この値は、選択したポイントに固有のものではありません。

時系列の精度(AOT)チャート

時系列の精度グラフには、選択した精度指標の値の経時変化が表示されます。 グラフの上にある指標タイルをクリックすると、表示が変更されます。

開始値(ベースライン精度スコア)とプロットされた精度ベースラインは、モデルの精度スコアを表します。これは、トレーニングされたモデルのホールドアウトパーティションでの予測を使用して計算されます。

カスタムモデルのホールドアウトパーティション

予測値と実測値の比較チャート

The Predicted & Actual chart shows the predicted and actual values over time. For binary classification projects, you can select which classification value to show (True or False in this example) from the dropdown menu at the top of the chart:

実測値が欠損している予測を識別するには、実測値が欠損しているIDのダウンロードリンクをクリックします。 実測値が欠損している予測をリストしたCSVファイル(missing_actuals.csv)が各予測の関連付けIDとともにダウンロードされます。 関連付けIDを使用して、一致するIDを持つ実測値をアップロードします。

Multiclass accuracy charts

Multiclass deployments provide the same Accuracy over Time and Predicted vs Actual charts as standard deployments; however, the charts differ slightly as they include individual classes and offer class-based configuration to define the data displayed. In addition, you can choose between viewing the data as Charts or a Table:

備考

By default, the charts display the five most common classes in the training data; if the number of classes exceeds five, all other classes are represented by a single line.

To configure the classes displayed, above the date slider, configure the Target Class dropdown, controlling which classes are selected to display on the selected tab:

Click the dropdown to determine which classes you want to display, then select one of the following:

オプション 説明
すべてのクラスを使用する Selects all five of the most common classes in the training data, along with a single line representing all other classes.
特定のクラスを選択する Do either of the following to display up to five classes:
  • Type the class names in the subsequent field to indicate those that you want to display.
  • Select a shortcut for: Most common in training, Least accurate, or Most drifted.

After you click Apply, the charts on the tab update to display the selected classes.

Interpret accuracy alerts

DataRobotは、アラートステータスを作成するための精度スコアとしてデプロイに選択された最適化メトリックス・タイルを使用します。 アラートステータスの意味を以下に示します。

精度 アクション
緑 / 合格 精度はモデルがデプロイされたときとほぼ同じです。 必要なアクションはありません。
黄色 / リスクあり 精度はモデルが展開されたときから低下しています。 懸念がありますが、早急のアクションは必要ありません。監視を継続してください。
赤 / 失敗 精度はモデルが展開されたときから大幅に低下しています。 早急なアクションが必要です。
グレー / 不明 精度データがありません。 予測が不十分(最低100が必要) 予測の作成。

更新しました April 8, 2024