Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

クラスごとのバイアス

クラスごとのバイアスは、モデルにバイアスがあるかどうか、バイアスがある場合は、そのバイアスの程度誰に対して好ましいまたは好ましくなバイアスかを特定するのに役立ちます。クラスごとのバイアス**をクリックすると、クラスごとのバイアスチャートが表示されます。

クラスごとのバイアスタブは、各クラスの公平性のしきい値と公平性スコアを使用して、特定のクラスがモデルの予測動作でバイアスを経験しているかどうかを判断します。公平性スコアがしきい値を下回るクラスは、バイアスが発生している可能性があります。そのようなクラスを特定したら、クラス間のデータの相違タブを使用して、モデルが学習バイアスのトレーニングデータのどこにあるかを判断します。

クラスごとのバイアスチャート

クラスごとのバイアスチャートのY軸は、選択された保護特徴量の個々のクラス値を表示します。X軸には、DataRobotの公平性指標を使用して計算されたクラスのそれぞれの公平性スコアが表示されます。スコアは絶対値または相対値のいずれかの形式で表示できます。

青いバーは、クラスが公平性のしきい値を超えていることを示します。赤いバーは、クラスがそのしきい値を下回っているため、モデルにバイアスがある可能性があることを示します。灰色のバーは、次のいずれかの理由により、クラスに十分なデータがないことを示します。

  • 100行未満です。
  • 行数は100~1,000行ですが、マジョリティークラス(データの行が最も多いクラス)に属する行が10%未満です。

クラスにカーソルを合わせると、絶対および相対の公平性スコア、クラスの値の個数、公平性テスト結果のサマリーなど、追加の詳細が表示されます。

このチャートの情報を使用すると、保護されたクラス間の結果にバイアスがあるかどうかを特定できます。次に、クラス間のデータの相違タブで、どの特徴量がこのバイアスに最大の影響を与えているのかを評価します。

チャート表示の制御

このチャートには、表示を変更するいくつかのコントロールがあり、特定の関心のある情報に焦点を合わせることができます。

予測しきい値

予測しきい値ROC曲線タブツール—は、二値分類モデルの結果を解釈するための境界線です。デフォルトのしきい値は0.5であり、この境界線より上のすべての予測には正のクラスラベルがあります。

不均衡なデータセットで、しきい値が0.5であると、正のクラス予測がない検定パーティションが生成され、クラスごとのバイアスタブでの公平性スコアの計算が妨げられる可能性があります。公平性スコアを再計算して表示するには、予測しきい値を変更してデータセットの不均衡を解決します。

すべての公平性指標(予測バランスを除く)では、公平性スコアを計算するときにモデルの予測しきい値が使用されます。この値を変更すると、公平性スコアが再計算され、チャートが更新されて新しい値が表示されます。

公平性指標

指標ドロップダウンメニューを使用して、X軸に表示される公平性スコアの計算にDataRobotが使用する公平性指標を変更します。

絶対値を表示

絶対値を表示するを選択すると、選択した公平性指標について各クラスが受け取った元のスコアを表示します。

相対値を表示

相対値を表示するを選択すると、公平性スコアが最も高いクラスが1にスケーリングされ、他のすべてのクラスの公平性スコアは1を基準にスケーリングされます。

この表示では、DataRobotが相対的な公平性スコアを使用して公平性のしきい値と照合するため、公平性のしきい値がチャートに表示されます。

保護された特徴量

プロジェクトのセットアップ中に設定されたすべての保護特徴量が左側に表示されます。保護された特徴量を1つ選択して、個別のクラス値と公平性スコアを表示します。


更新しました September 28, 2022
Back to top