XEMPの質的強度¶
XEMPベースの予測の説明では、インサイトが提示する各説明の質的強度を視覚的に示すことができます。 APIでは、これらの値は、予測の説明APIエンドポイントのqualitativeStrength応答パラメーターから返されます。
分布は、検定データからの近似です。プレビューは検定データで計算されます。
スコアの変換¶
モデル内の特徴量の数が異なる場合、インジケーター(たとえば、+++、++、+)間の境界は異なります。 以下の表は、特徴量数に基づいて、計算値がどのように視覚的表現に変換されるかを示しています。 表では、qは「質的」(または「正規化」)スコアを表します。
備考:
-
説明のスコアが些末で、質的効果がほとんどない場合またはまったくない場合、出力にはグレーアウトされた3つの記号(
+++または---)が表示されます。 これは、提示された方向性に対して、効果が小さいことを示しています。 -
特徴量が多数ある場合、0.2より大きい正規化スコアは
+++で表されるため、複数の特徴量でこのシンボリックスコアを1行で表示することが可能です。
How is the q value calculated?
DataRobot calculates the "qualitative score" or "q" value in the tables below from a normalization process. For the top 50 features, ranked by global Feature Impact score, explanation strengths' raw values are available. To calculate those values, DataRobot does the following on each row:
- Computes explanation strengths (sometimes called “raw scores”) for eligible features. (In the API, this value is returned as
strength.) - Computes a normalization factor. The value used for normalization is the sum of the top 10 largest absolute strengths. This value may differ between rows.
- Generates a normalized (qualitative or “q” score) by dividing all explanation strengths by the computed normalization factor. (This value is not available in the API.)
Use the tables below to convert the normalized scores to qualitative symbols.
特徴量 = 1¶
単一の特徴量で構築されたモデルにおいて、計算された質的スコアに基づいて表示されるシンボリックスコアについて説明します。
| 質的スコア | シンボリックスコア |
|---|---|
| q <= -0.001 | --- |
| -0.001 < q <= 0 | グレーアウト --- |
| 0 < q < 0.001 | グレーアウト +++ |
| q >= 0.001 | +++ |
特徴量 = 2¶
2つの特徴量で構築されたモデルにおいて、計算された質的スコアに基づいて表示されるシンボリックスコアについて説明します。
| 質的スコア | シンボリックスコア |
|---|---|
| q < -0.75 | --- |
| -0.75 <= q < -0.25 | -- |
| -0.25 <= q <= -0.001 | - |
| -0.001 < q <= 0 | グレーアウト --- |
| 0 < q < 0.001 | グレーアウト +++ |
| 0.001 <= q <= 0.25 | + |
| 0.25 < q <= 0.75 | ++ |
| q > 0.75 | +++ |
特徴量 >= 2、< 10¶
2個以上10個未満の特徴量で構築されたモデルにおいて、計算された質的スコアに基づいて表示されるシンボリックスコアについて説明します。
| 質的スコア | シンボリックスコア |
|---|---|
| q < -2 / num_features | --- |
| -2 / num_features <= q < -1 / (2 * num_features) | -- |
| -1 / (2 * num_features)<= q <= -0.001 | - |
| -0.001 < q <= 0 | グレーアウト --- |
| 0 < q < 0.001 | グレーアウト +++ |
| 0.001 <= q <= 1 /(2 * num_features) | + |
| 1 / (2 * num_features)< q <= 2 / num_features | ++ |
| q > 2 / num_features | +++ |
特徴量 >= 10¶
For the top 50 features, ranked by global Feature Impact score, explanation strengths are available. To calculate those values, DataRobot does the following on each row:
- Computes explanation strengths (sometimes called “raw scores”) for eligible features. (In the API, this value is returned as
strength.) - Computes a normalization factor. The value used for normalization is the sum of the top 10 largest absolute strengths. This value may differ between rows.
- Generates a normalized (qualitative or “q” score) by dividing all explanation strengths by the computed normalization factor. (This value is not available in the API.)
Use the table below to convert the normalized scores to qualitative symbols.
10以上の特徴量で構築されたモデルにおいて、計算された質的スコアに基づいて表示されるシンボリックスコアについて説明します。
| 質的スコア | シンボリックスコア |
|---|---|
| q < -0.2 | --- |
| -0.2 <= q < -0.05 | -- |
| -0.05 <= q <= -0.001 | - |
| -0.001 < q <= 0 | グレーアウト --- |
| 0 < q < 0.001 | グレーアウト +++ |
| 0.001 <= q <= 0.05 | + |
| 0.05 < q <= 0.2 | ++ |
| q > 0.2 | +++ |