Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

SHAPベースの予測の説明

備考

このセクションでは、SHAPベースの予測の説明について説明します。SHAPおよびXEMPベースの方法の概要については、予測の説明の全般的な説明も参照してください。

SHAPベースの予測の説明を取得するには、モデルを構築する前に、高度なオプションでSHAP値をサポートするモデルのみを含めるを有効にする必要があります。

SHAPベースの予測の説明は、各特徴量が平均とは異なる所定の予測にどの程度寄与しているのか推定します。これらは直感的で、制限がなく(すべての機能について計算されます)、高速で、SHAPのオープンソースの性質上、透過的です。SHAPの利点は、モデルの動作をすばやく理解するだけでなく、モデルがビジネスルールに準拠しているかどうかも簡単に検定できます。

SHAPを使用して、モデルの決定ごとに鍵となる特徴量を理解します。特定の顧客の購入を推進するものは年齢に関連するのか。性別なのか。購入する習慣なのか。各要因が決定に与える大きさはどのくらいなのか。

予測の説明のプレビュー

DataRobotは、EDA2中にトレーニングデータのSHAP予測の説明を自動的に計算します。モデルの準備ができれば、予測説明タブで結果をレビューできます。この表示は、モデルの性能の一般的な「直感」を提供するために上位5つの特徴量のプレビューを表示します。その後、トレーニングデータセット全体の説明をすばやく計算してダウンロードし、詳細な分析を実行できます。外部データセットをアップロードすることや、説明を手動で計算(およびダウンロード)することも可能です。

デプロイ済みモデルとリーダーボードモデルの両方について、APIを介して説明にアクセスすることもできます。

SHAP予測の説明の解釈

予測の説明タブには、平均(基準)値からの差分に最も貢献する上位5位の特徴量のインタラクティブなプレビューが表示されます。言い換えれば、これは、各特徴量がどの程度違いを説明しているかを示します。例:

  • 基本予測値(平均(1))は43.11です。
  • 行(2)の予測値は67.5です。

基本予測値を行予測値から引いて、平均との差を算出します(この場合24.4)。

  • 貢献度(3)は、上位5つの特徴量(4)のそれぞれについて、各特徴量がどの程度違いを説明しているか(特徴量間における24.4の割り当て)を示しています。ターゲットは平均からの差分にどれだけ貢献しているか。

SHAPは加法的なので、すべての特徴量のすべての貢献の合計は、基本値と行予測値の差に等しくなります。(加法性の詳細についてはここを参照してください。)

視覚化の解釈に関する追加のメモ:

  • 貢献は、正または負です。予測値を押し上げる特徴量は、赤で表示される正の数値です。予測を減らす機能は青で表示される負の数です。

  • プロット上の矢印は、観測された予測に正と負の影響を与えるSHAP値に比例しています。

  • 「その他すべての特徴量の合計」は、貢献度が高い上位5つの特徴量の一部ではない特徴量の合計です。

加法性(潜在的な破損見越し高を含む)の詳細については、SHAPリファレンスを参照してください。

分布上のポイントの表示

予測分布コンポーネントを使用して、予測値の範囲をクリックし、上限値と下限値がどのように説明されるかを理解します。グラフのY軸は予測値を示し、X軸は頻度を示します。

分布の下部近くのポイントを見ると、貢献値は赤の値よりも青(正の貢献よりも負)であることに注意してください。これは、主要な特徴量の大半が予測値を引き下げているためです。

説明の計算とダウンロード

DataRobotでは、選択したレコードの説明が自動的に計算されますが、計算機()アイコンをクリックしてすべてのレコードの説明を計算することができます。DataRobotでは残りの説明が計算され、準備ができたらダウンロードボタンがアクティブになります。クリックすると、説明のリストがCSVファイルとして保存されます。CSVには、各レコードの上位100の説明のみが含まれることに注意してください。すべての説明を表示するには、APIを使用してください。

データセットのアップロード

同じモデルを使用して追加データの説明を計算するには、新規データセットをアップロードをクリックします。

新規の外部データセットをアップロードできる予測を作成タブが開きます。完了したら、予測の説明に戻ります。ここでは新しいデータセットがダウンロード領域にリストされます。

トレーニングデータセットと同様の方法で、説明を計算()してダウンロードします。DataRobotは、外部セット全体の計算を実行します。


更新しました February 22, 2022
Back to top