Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

クラス間のデータの相違

クラス間のデータの相違のインサイトは、モデルにバイアスがある理由、およびモデルがバイアスをトレーニングデータのどこから学習したかを示します。

クラス間のデータ相違のチャートを表示するには、クラス間のデータの相違をクリックします。 保護された特徴量とその特徴量の2つのクラス値を選択して、データの相違を測定します。 ページが更新され、選択に基づいてデータの相違と特徴量の有用性チャートと特徴量の詳細チャートが表示されます。 これらのグラフを組み合わせて使用して、選択したクラスのモデルのバイアスの根本原因分析を実行しますデータの相違と特徴量の有用性チャートを使用して、データセット内のどの特徴量がバイアスに最も影響を与えるかを特定します。また特徴量の詳細チャートを使用して、特徴量内のどこにバイアスが存在するかを調査します。

データの不一致と特徴量の有用性との比較チャート

データの相違と特徴量の有用性チャートは、保護された特徴量の2つのクラス値の主な相違を特定するのに役立ちます。 チャートは、保護された特徴量の選択されたクラスペアに最大の影響を与える最大100個の特徴量をプロットします。 表示される特徴量の数を変更するには、設定アイコンをクリックします。

グラフ上の各ポイントは、1つの特徴量を表します。 X軸に沿ったポイントの配置によって特徴量のインパクトを示し、Y軸は保護された2つのクラス間での特徴量のデータ分布の差異を示します。 この値は、PSI(Population Stability Index)を計算したもので、時間経過に伴う分布の差異を示す指標です。

各点の色は、2つの軸の組み合わせを表します。赤は有用性の高い特徴量と相違の大きい特徴量を示し、緑は相違の小さい特徴量と有用性の低い特徴量を示します。 黄色は、その間のすべてを表します。

以下に示すように、ポイントの周囲の追加の境界線は、プロジェクトのターゲット特徴量を示します。

ポイントにカーソルを合わせると、特徴量名、有用性、データ相違の計算スコアが表示されます。 計算されたスコアは特徴量の影響を測定するものであり、理解 > 特徴量のインパクトタブにも表示されます。

2つのクラスセグメント間の差異に大きな影響を与える特徴量を特定したら、特徴量の詳細チャートで2つのクラス間の値の分布を表示することで差異を調査できます。

特徴量の詳細チャート

特徴量の詳細チャートには、保護された特徴量の2つのクラスセグメント間の特徴量の値の分布が表示されます。 ドロップダウンには、データの相違と特徴量の有用性 チャートの10個の特徴量が含まれます。 チャートのカテゴリー値は、正規化された差分でソートされます。特殊な処理により、「0で除算」となる状況が回避されます。

クリックしてデータの相違と特徴量の有用性チャートのポイントを選択するか、または特徴量の詳細チャートを更新して、2つのクラス値間の分布の違いを表示します。

モデルが各特徴量間の関係性をどのように解釈するかを調べるには、特徴量ごとの作用を表示するをクリックして、特徴量ごとの作用タブに移動します。


更新しました October 16, 2024