Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

クラス間のデータの相違

クラス間のデータの相違のインサイトは、モデルにバイアスがある理由、およびモデルがバイアスをトレーニングデータのどこから学習したかを示します。

クラス間のデータ相違のチャートを表示するには、クラス間のデータの相違をクリックします。保護された特徴量とその特徴量の2つのクラス値を選択して、データの相違を測定します。ページが更新され、選択に基づいてデータの相違と特徴量の有用性チャートと特徴量の詳細チャートが表示されます。これらのチャートを組み合わせて使用して、選択したクラスのモデルのバイアスの根本原因分析を実行します。データの相違と特徴量の有用性チャートを使用して、データセット内のどの特徴量がバイアスに最も影響を与えるかを特定します。また特徴量の詳細チャートを使用して、特徴量内のどこにバイアスが存在するかを調査します。

データの相違と特徴量の有用性との比較チャート

データの相違と特徴量の有用性チャートは、保護された特徴量の2つのクラス値の主な相違を特定するのに役立ちます。チャートは、保護された特徴量の選択されたクラスペアに最大の影響を与える最大100個の特徴量をプロットします。表示される特徴量の数を変更するには、設定アイコンをクリックします。

グラフ上の1つ点が、単一の特徴量を表します。x軸に沿った点の配置は、特徴量の有用性を示し、y軸は、保護された2つのクラス間の特徴量のデータ分布の相違を測定します。この値は、母集団安定性指標(PSI)(時間の経過に伴う分布の差異の測定)の計算です。

各点の色は、2つの軸の組み合わせを表します。赤は有用性の高い特徴量と相違の大きい特徴量を示し、緑は相違の小さい特徴量と有用性の低い特徴量を示します。黄色は、その間のすべてを表します。

以下に示すように、ポイントの周囲の追加の境界線は、プロジェクトのターゲット特徴量を示します。

ポイントにカーソルを合わせると、特徴量名および有用性とデータ相違の計算スコアが表示されます。計算されたスコアは特徴量の影響を測定するものであり、理解 > 特徴量のインパクトタブにも表示されます。

2つのクラスセグメント間の差異に大きな影響を与える特徴量を特定したら、特徴量の詳細チャートで2つのクラス間の値の分布を表示することで差異を調査できます。

特徴量の詳細チャート

特徴量の詳細チャートには、保護された特徴量の2つのクラスセグメント間の特徴量の値の分布が表示されます。ドロップダウンには、データの相違と特徴量の有用性チャートの10個の特徴量が含まれます。

クリックしてデータの相違と特徴量の有用性の比較チャートのポイント選択するか、またはドロップダウンから特徴量を選択すると、特徴量の詳細チャートが更新され、2つのクラス値間の分布の違いが表示されます。

モデルが各特徴量間の関係性をどのように解釈するかを調べるには、特徴量ごとの作用を表示するをクリックして、特徴量ごとの作用タブに移動します。


更新しました February 22, 2022
Back to top