Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

XEMP予測の説明

備考

このセクションでは、XEMPベースの予測の説明について説明します。SHAPおよびXEMPベースの方法の概要については、予測の説明の全般的な説明も参照してください。

XEMPベースの予測の説明を表示するには、最初に特徴量のインパクトを計算する必要があります。この処理は、予測の説明タブまたは特徴量のインパクトタブから行うことができます。(タブは計算結果を共有します。)どちらかのタブで計算したインパクトは、もう一方のタブでも結果を表示できます。特徴量のインパクトの計算の出力は特徴量のインパクトタブにだけ表示されますが、予測の説明の計算にも使用されます。計算処理が完了すると、予測の説明の結果が表示されます。

結果のページには、以下に詳細を示す次の要素が表示されます。Visual Artificial Intelligence (AI)プロジェクトの追加要素(以下の説明を参照)を使用して画像特徴量のユニーク数の品質をサポートできます。

要素 説明
入力の計算 各レコードに対して返す説明の数を設定し、選択に低および/または高範囲を適用するかどうかを切り替えます。
しきい値の変更 予測の選択の低および高検定スコアを設定します。
予測の説明のプレビュー 入力およびしきい値設定に基づいて、検定データからの説明のプレビューを表示します。
計算機 選択した条件を使用して、選択された予測および完全な予測セットの説明の計算を開始します。

予測の説明の概要

以下の手順は、アップロードしたデータセットを予測の説明タブを使用する方法の概要を示します。追加のデータセットをアップロードして説明の計算を行うこともできます。

  1. 選択したモデルの予測の説明をクリックします。
  2. モデルに対して特徴量のインパクトがまだ計算されていない場合は、特徴量のインパクトを有効化ボタンをクリックします。

    計算が完了するとデフォルト値(下記参照)を使用してプレビューが表示されます。

  3. 予測の説明のプレビューを調査します。

  4. 必要に応じて、計算入力しきい値を変更してプレビューを更新します。
  5. 新しい値を使用して計算処理を行い、結果をダウンロードします。

同じモデルを使用して、すべてのデータセット(トレーニング、検定、テスト、予測)にデフォルトまたはユーザー指定のベースラインしきい値が適用されます。ベースラインを変更した場合、プレビューを更新して、更新したデータセットの予想の説明を再計算する必要があります。

XEMP予測の説明の解釈

サンプルプレビューは以下のように表示されます。

この結果を説明する簡単な方法は以下の通りです。

0.894の予測値は、行4936にあります。その値については、6つの表示された特徴量が予測に最も高いPositiveインパクトを持っています。

上記の例から、「患者が再入院する確率がモデルで89.4%とされた理由」を知ることができます。説明は、患者の体重、緊急外来の回数(3)、および薬の全てにおいて(positive)予測に強力なpositive効果があることを説明します(理由はその他にもあり)。

分布は検証データから近似されます。プレビューは検証データで計算されます。各予測に対して、DataRobotは説明のリストを並び替えます。説明の数は設定に基づきます。各説明は、データセットの特徴量とそれに対応する値であり、説明の強度に関する定量的なインジケーターが付きます。インジケーターは、強(+++)、中(++)、弱(+)の陽性または陰性(-)の影響を表します。説明のスコアが些末で、影響力がほとんどない場合またはまったくない場合、出力にはグレーアウトされた3つの記号(+++または---)が表示されます。これは、影響力が微弱であり方向性があることを示します。

予測値をスクロールして、他の患者の結果を表示します。

説明に関する注意

以下の点を考慮してください。

  • データポイントが非常に小さい場合、説明では丸められた同じ値が一覧表示されます。
  • 予測の作成で「欠損値」が重要な場合(強力なインジケーター)、説明の状態に「欠損」と表示されることがあります。
  • 一般的に、予測の上位の説明の方向は出力と同じですが、特徴量の間の相互効果または相関によって、negative予測に対して説明が強いpositive効果を示すことあります。
  • ID列の数値は、インポートしたデータセットの行番号IDです。
  • 高確率予測で負の影響の説明が表示されることがあります(または、逆に低スコア予測は高いpositive効果を含む特徴量を示します)。その場合、予測の説明は、特徴量の値が異なっている際に予測の確率が更に高くなる可能性を示しています。

    例えば、血圧は正常で、腰を骨折した107歳の女性の再入院のリスクを予測するとします。この女性の再入院の確率は間違いなく高くなりますが、血圧は正常なので、(全体的なリスクスコアは非常に高いものの)リスクスコアは低くなります。血圧の予測の説明は、特徴量が異なる場合、予測の確率が高くなることを示しています。

プレビューの変更

DataRobotでは、トレーニングデータ(検定セットなど)の最大6つの予測に対して最大10の予測の説明のプレビューが計算されます。

予測の説明タブのデフォルト設定を以下に示します。

要素 デフォルト値 注意
予測の説明の数 3 説明の数を1~10の間で設定します。
予測の数 6(最大) 表示されるプレビュー予測の数は、指定範囲に含まれるデータポイントの数に応じて異なります。例えば、指定範囲に4つのデータポイントしかない場合、プレビューには4つの行しか表示されません。
低しきい値チェックボックス 選択済み N/A
高しきい値チェックボックス 選択済み N/A
予測しきい値の範囲 予測分布の上下10% ドラッグして変更します。

予測および説明のプレビューではトレーニングデータが自動的に使用可能になります。予測データセットをアップロードすると、予測の完全なセットの予測の説明が計算されます。

計算入力しきい値を変更すると、プレビューを更新するよう求めるメッセージが表示されます。

更新をクリックして、新しい設定でプレビューを再表示します。以前の設定に戻すには、変更を取り消すをクリックします。プレビューを更新すると、ハイライトされた範囲内の最大6つの予測のパラメーターで予測の新しいセットが生成されます。

計算入力の変更

予測の説明を計算する場合、設定できる3つの入力があります。それは、チェックされた場合は低の低のしきい値予測のしきい値(高)の、チェックされていない場合はしきい値なし、各予測の説明の数です。

説明の数を変更するには、入力して(またはボックス内の矢印を使用して)、1〜10の値を設定します。低ボタンと高しきい値ボックスをチェックして、スライダーを使用して、予測説明を表示する範囲を設定します。入力値を変更するとプレビューを更新するよう求めるメッセージが表示されます。

ヒント

しきい値を変更したとき(および変更内容を保存するとき)は、更新をクリックする必要があります。

しきい値の変更

しきい値によって、DataRobotで予測が取得される予測分布の範囲が決定されます。しきい値を変更するには、低または高しきい値のバーを目的の位置までドラッグしてプレビューを更新します。

低および高しきい値フィルターを適用して計算の速度を上げることができます。少なくとも1つのフィルターを指定すると、選択した外れ値行の予測の説明だけが計算されます。予測値(連続値プロジェクトの場合)または陽性分類になる可能性(分類プロジェクトの場合)が低しきい値よりも低い場合、または高しきい値よりも高い場合、行は外れ値とみなされます。両方のフィルターをオフにすると、すべての行の予測の説明が計算されます。

エクスポージャーが(連続値プロジェクトで)設定されている場合、分布には、調整済み予測(エクスポージャーを除数として割られた予測など)の分布が示されます。同様に、分散グラフのラベルは、検定予測/エクスポージャーに変更され、プレビューテーブルの予測列の名前は予測/エクスポージャーに変更されます。

予測を計算およびダウンロード

DataRobotは、トレーニングデータの検証セットから最大6つの予測説明を自動的に表示します。これは初期画面に表示されます。ただし、完全なトレーニングパーティション(1)、完了したデータセット(2)、または新しいデータセット(3)の説明を計算およびダウンロードできます。

データセットのアップロード

指定したしきい値で目的の予測の種類と範囲が返されることを確認したら、1つ以上の予測データセットをアップロードします。以下の手順を実行します。

  1. + 新規データセットをアップロードをクリックします。予測の作成タブに移動します。ここでは、アップロードするデータセットを参照、インポート、またはドラッグできます。オプションで、列を追加します
  2. データセットをインポートします。インポートが完了したら、解釈 > 予測の説明タブを再度クリックして戻ります。

列の追加

予測結果に列を追加する必要がある場合があります。追加は、必要になる追加の後処理作業を最小化する場合などに便利なツールです。デフォルトでは、ターゲット特徴量は説明の出力に含まれないので、ターゲット特徴量を追加するのは一般的な操作です。

追加操作はその他の操作から独立しているので、予測の説明ワークフローの任意のポイント(新しいデータセットのアップロード前または後、あるいは計算の実行中)で追加できます。ダウンロードを開始すると、出力に追加した列が追加されます。

特徴量を追加するには、予測の作成タブに切り替えるか、新しいデータセットをアップロードをクリックして該当するタブを表示します(追加できるのはモデルを構築したときに存在した列だけです)。手順5から始まる手順に従います。

完全な説明の計算

デフォルトでは、インサイトは検証データが反映されている場合がありますが、プロジェクトのトレーニングデータ内のすべてのデータポイントの予測と説明を表示できます。この場合、「トレーニングデータ」 というデータセットの横にある計算ボタン()をクリックしてください。このデータセットは自動的にすべてのモデルで使用可能になります。

予測の説明の生成とダウンロード

アップロードしたデータセットから予測の説明を生成できます。しかし、最初にプレビューの6つの予測だけでなく、全ての予測の説明を計算する必要があります。データセットをアップロードした後に予測を計算してダウンロードするには

  1. データセットのすべての予測の説明が計算されていない場合は、データセットの右側にある計算機アイコン()をクリックして説明の計算を開始します。

  2. 説明の計算モーダルのフィールドに入力してパラメーターを設定し、計算をクリックして対応するデータセットの各行の説明を計算します。

    DataRobotが説明の計算を開始します。ワーカーキューの進捗を追跡します。

  3. 計算が完了すると、データセットはダウンロードが可能なものとしてマークされます。

  4. ダウンロードボタン()をクリックして、すべてのデータセット予測および対応するリーズンをCSV形式でエクスポートします。アセンブルが完了すると、保存場所までブラウズよう指示されます。

    選択範囲外の予測もデータに含まれますが、説明は含まれません。

  5. 設定を更新した場合(しきい値または予測の数を変更した場合)、更新ボタンをクリックしてから、計算機をクリックして説明を再計算する必要があります。

備考

最新バージョンの説明だけがデータセット用に保存されます。パラメーター設定を比較するには、設定の予測の説明CSVをダウンロードして、新しい設定で再度実行します。

Visual AIの予測の説明

Visual Artificial Intelligence (AI)プロジェクトの予測の説明(画像の説明)を使用すると、「画像」タイプの特徴量を含むデータセットの説明を取得できます。Visual Artificial Intelligence (AI)の画像の説明では、上記のすべての機能に加えて、いくつかの追加機能がサポートされています。

計算が完了すると、イメージが説明の重要な部分であることを示すアイコンが追加されます。

アイコン()をクリックすると、イメージの説明をドリルダウンできます。

アクティベーションマップをオンにすると、イメージ内でモデルの「対象」を確認できます。

説明の計算とダウンロード

予測の説明と同様に、データセット内の各行の予測の計算と説明のダウンロードを行うことができます。ダウンロードしたイメージの説明アーカイブには、以下のものが含まれます。

  • 予測CSVファイル(1)
  • イメージのフォルダー(2)

CSVには、説明の一部であるイメージ特徴量のイメージファイル名が特徴量の値としてリストされます。

画像フォルダーには、関連する画像のレンダリング(ヒートマップ)された写真が含まれています。


更新しました February 22, 2022
Back to top