Skip to content

残差

タブ 説明
パフォーマンス モデルの予測パフォーマンスと妥当性を理解するのに役立ちます。

連続値エクスペリメントでは、残差を使用することで、使用するデータセットの実測値に対してモデルがどの程度線形にスケーリングされるかを測定できます。 これには、残差分析に役立つ複数の散布図および1つのヒストグラムが表示されます。

  • 予測値と実測値の比較
  • 残差と実測値の比較
  • 残差と予測値の比較
  • 残差ヒストグラム

Predicted values are those predicted by the model, actual values are the real-world outcome data, and residual values represent the difference of predicted value - actual value.

備考

The Residuals tab is not available for frozen run models if there are no out-of-sample predictions. 親モデルの残差タブにリダイレクトされます。

個々のプロットへのアクセス

From the Residuals tab, you can access Residuals or Predictions distribution independently:

  • 残差と実測値を比較する散布図、残差と予測値を比較する散布図、および残差ヒストグラムを表示するには、残差分布を選択します。

  • 予測値と実測値を比較する散布図を表示するには、予測分布を選択します。

プロットとグラフの解釈

各散布図には、さまざまな分析要素が含まれます。

精度パラメーター

レポートされる残差平均値(1)は、予測値と実測値の間の平均差です。

r^2として表される決定係数値(2)は、独立特徴量から予測できる依存特徴量の分散の比率です。

標準偏差値(3)は、データセットの分散を測定します。 低い値を設定すると、データポイントが平均値に近くなります。高い値を設定すると、データポイントは値の広い範囲に分散します。

プロットとグラフアクション

ヒント

この視覚化は、スライスされたインサイトに対応しています。 スライスを使用すると、特徴量値に基づいてモデルのデータの部分母集団をユーザー設定で定義でき、モデルがさまざまなデータセグメントに対してどのように動作するかをよりよく理解するのに役立ちます。 詳細については、完全なドキュメントを参照してください。

残差プロットおよびグラフでは、データの選択、データスライス、エクスポート、設定などのさまざまなアクションを利用できます。

各散布図の下にあるデータ選択ドロップダウンでは、データソースを切り替えることができます。 検定データ、交差検定データ、またはホールドアウトデータを選択します。

エクスポートボタンを使用すると、PNG、CSV、またはZIPファイルとして分布図をエクスポートできます。

設定ホイールアイコンを使用すると、x軸とy軸のスケーリングを調整できます。 各軸に対して線形または対数スケーリングを選択すると、すべてのグラフが選択内容に応じて調整されます。

たとえば、線形スケーリング(左)と対数スケーリング(右)を使用した予測値と実測値のプロットを比較します。

プロットの領域をさらに詳しく調べるには、プロットにカーソルを合わせてズームインまたはズームアウトします。

ズームインしたら、プロットをクリックしてドラッグしてさまざまな領域を調べることができます。

散布図の操作

チェックボックスを選択することによって、標準偏差のx倍大きい残差をハイライトできます。

残差の倍数を指定する数を入力します。 残差をハイライトするには、標準偏差よりも大きい数を入力する必要があります。たとえば、3に設定すると、標準偏差の3倍の値のデータポイントだけがハイライトされます。 ハイライトされた残差は黄色いポイントによってあらわされます。

プロットの個々のポイントの上にマウスを置くと、データポイントビンが表示されます。 ビンでは、青いドットの予測値または残差地を実測値と比較できます。 予測値対実測値のプロットの場合、特定のドットの上にマウスを置くと、予測値(青いドット)がその特定の実測値(グレーのライン)からどれだけ異なっているかを比較できます。

残差と実測値を比較するプロットの場合、特定のポイントの上にマウスカーソルを置くと、実測値の正確な残差が表示されます。 各ドットの座標は、これらの値(Y軸座標の残差値とX軸座標の実測値)に基づきます。水平のグレーの線からの距離は、予測値と実測値の間の差分を示します。 差分が大きいほど、ポイントと線の間の距離が大きくなります。

残差と予測値を比較するプロットの構造も同じですが、予測値と残差が比較されます。

残差ヒストグラムは、値の範囲ごとに残差がビニングされ、各ビンの残差の数が測定されます。