混同行列¶
ROC曲線タブは、実測値と予測値を比較することで精度を評価できる混同行列を提供します。 混同行列は、実測値と予測値をまとめた表のことです。 モデルが2つのクラスを混同している(1つのクラスをもう1つのクラスと混同してしまう)かどうかを示す行列であることから、「混同行列」という名称が使われています。
混同行列は、精度だけに頼らず、より詳細な分析結果を活用します。 精度は、データセットが不均衡である場合(異なるクラスのサンプル数に大きく変動する)誤った結果を生じるため、分類子の実際のパフォーマンスについて、常に信頼できる指標ではないと考えられます。
混同行列を用いて精度を評価するには:
混同行列の分析¶
以下の混同行列の行と列は、再入院分類ユースケースのTrueとFalseの値を報告しています。
備考
予測分布グラフは、同じ値と定義を使用します。
-
行列の各列には、予測された分類のインスタンスを表しています(再入院しないと予測、再入院すると予測)。
-
行列の各行には、実測された分類のインスタンスを表しています(実際に再入院しなかった、実際に再入院した)。 上記例の左側の実測軸を見ると、Trueは青い行に対応し、Positiveクラス(1または再入院した)を表し、Falseは赤い行に対応し、Negativeクラス(0または再入院しなかった)を表します。
-
正しい予測の合計はTP + TNで構成され、誤った予測の合計はFP + FNで構成されます。 上で例として示した行列では:
値 モデル予測 True Negative(TN) 再入院しないと予測され、実際に再入院しなかった患者は459名です。 実際の結果がFalseであった場合に、正しくFalseと予測しました。 False Positive(FP) 再入院すると予測されても、実際には再入院しなかった患者は506名です。 実際の結果がFalseであった場合に、誤ってTrueと予測しました。 False Negative(FN) 再入院しないと予測されても、実際には再入院した患者は123名です。 実際の結果がTrueであった場合に、誤ってFalseと予測しました。 True Positive(TP) 再入院すると予測され、実際に再入院した患者は512名です。 実際の結果がTrueであった場合に、正しくTrueと予測しました。 -
行列には、行と列ごとの合計が表示されます。
-
合計数を表示するには、行列内のセルにカーソルを合わせます。 ツールチップには、個々のセルの値だけでなく、マージナルトータル(行と列の合計)が表示されます。 この例では、459 + 123名がFalse値として予測されましたが、実際には123名がTrueでした。 これらの値は、データの分布を理解するのに役立ちます。
-
行列から導き出せる主な指標は、以下のように計算されます(こちらに説明があります)。
精度 計算方法 精度 (459 + 512) ÷ 1600 = 60.7% 全体で60.7%の予測が正確でした。 プレシジョン 512 ÷ (512 + 506) = 50.3% 陽性予測の50.3%が正確でした。 リコール/感度 512 ÷ (512 + 123) = 80.6% 実際の陽性数の80.6%が検出されました。 真陰性率 459 ÷ (459 + 506) = 47.6% 実際の陰性数の47.6%が正しく識別されました。
カウントの違い¶
スマートダウンサンプリングが有効になっている場合、混同行列の合計はデータパーティションのサイズ(検定、交差検定、ホールドアウト)と若干異なる場合があります。 これは主に丸め誤差に起因します。 実際に、マイノリティークラスの行には常に1の「重み」が割り当てられます(高度なオプションで設定された重みと混同しないよう、ダウンサンプリング中に削除されることはありません)。 マジョリティークラスの行のみが1より大きい「加重」を取得し、ダウンサンプリングされる可能性があります。
高度なオプションで(Classic)、または高度なエクスペリメント設定の一部として(NextGen)重みを適用した場合、混同行列に表示されるカウントは、トレーニングセットの行数と一致しません。 これは、精度最適化指標で重みの合計が使用されるためです。 以下に具体例を示します。
混同行列の各セルは、そのセルのサンプル加重の合計になります。重みが指定されない場合、暗黙の重みは1なので、重みの合計は観測値の数でもあります。


