Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

混同行列

ROC曲線タブは、実測値と予測値を比較することで精度を評価できる混同行列を提供します。

混同行列の説明

混同行列は、実測値と予測値をまとめた表のことです。「混同行列」という名前は、モデルが2つの分類を混同している場合(1つのクラスをもう1つのクラスと混同してしまう場合)、行列で表現することによってわかりやすくすることに由来します。

ユースケース2を表す下記の混同行列を考慮してください。

  • 行列の各列には、予測された分類のインスタンスを表しています(再入院しないと予測、再入院すると予測)。

  • 行列の各行には、実測された分類のインスタンスを表しています(実際に再入院しなかった、実際に再入院した)。 上記の例の左側の「実際の」軸を見ると、「True」は青い行に対応し、正のクラス(1または再入院した)を表し、「False」は赤い行に対応し、負のクラスを表します。 (0または再入院しなかった)。

  • 正しい予測の合計はTP+TN、誤った予測の合計はFP+FNです。ユースケース2について、サンプル行列を以下のように解釈することができます(左から右、上から下に読んでください)。

モデル予測
True Negative(TN) 再入院しないと予測され、実際に再入院しなかった541人の患者。
False Postive(FP) 再入院すると予測され、実際に再入院しなかった666人の患者。
False Negative(FN) 再入院しないと予測され、実際に再入院した126人の患者。
True Positive(TP) 再入院すると予測され、実際に再入院した667人の患者。

予測分布グラフは、同じ値と定義を使用します。

混同行列は、精度だけに頼らず、より詳細な分析結果を活用します。正解率はデータセットが不均衡である場合(異なるクラスのサンプル数に大きく変動する)、分類子の実際の性能について、常に信頼できる指標ではないと考えられます。

スマートダウンサンプリングが有効になっている場合、混同行列の合計はデータパーティションのサイズ(検定、交差検定、ホールドアウト)と若干異なる場合があります。これは主に丸め誤差に起因します。実際には、マイノリティークラスの行には常に1の「加重」が割り当てられます(高度なオプションで設定する加重と混同しないように注意してください。この加重が、ダウンサンプリング中に削除されることはありません。)マジョリティークラスの行だけが1より大きい「加重」を取得し、ダウンサンプリングされる可能性があります。

ヒント

行列のセル(左上上位のTrue Negativeセルなど)にカーソルを合わせると、合計数が数値または割合として確認できます(ここに表示される数値としての数値)。


更新しました February 22, 2022
Back to top