出力形式¶
予測は列テーブル形式で返されます。 各サンプル値の後には、その値が属するデータ型が続きます。 返される列は、次に示すモデルタイプによって決定されます。
備考
DataRobotでは、文字列の一意のバージョン(たとえば、TEXT
と呼ばれる場合もあれば、VARCHAR
と呼ばれる場合もある)を持つさまざまなデータベースに予測を出力できます。
そのため、DataRobotは実装固有のデータ型を提供できません。
連続値モデル¶
予測ラベル | |
---|---|
列名 | <target_name>_PREDICTION |
データ型 | 数値 |
サンプル名 | revenue_PREDICTION |
サンプル値 | 493822.12 |
説明 | 予測値 |
二値分類モデル¶
Positiveラベル | |
---|---|
列名 | <target_name>_<positive_label>_PREDICTION |
データ型 | 数値 |
サンプル名 | isbadbuy_1_PREDICTION |
サンプル値 | 0.28 |
説明 | Positiveラベルの浮動確率 |
Negativeラベル | |
---|---|
列名 | <target_name>_<negative_label>_PREDICTION |
データ型 | 数値 |
サンプル名 | isbadbuy_0_PREDICTION |
サンプル値 | 0.72 |
説明 | Negativeラベルの浮動確率 |
予測ラベル | |
---|---|
データ型 | テキスト |
列名 | <target_name>_PREDICTION |
サンプル名 | isbadbuy_PREDICTION |
サンプル値 | 0 |
説明 | 分類の予測ラベル |
しきい値ラベル | |
---|---|
列名 | THRESHOLD |
データ型 | 数値 |
サンプル名 | THRESHOLD |
サンプル値 | 0.5 |
説明 | ラベルを決定するために使用する浮動予測しきい値 |
Positiveクラスラベル | |
---|---|
列名 | POSITIVE_CLASS |
データ型 | テキスト |
サンプル名 | POSITIVE_CLASS |
サンプル値 | 1 |
説明 | ポジティブクラスとして設定されたラベル |
多クラス分類モデル¶
予測ラベル | |
---|---|
列名 | <target_name>_PREDICTION |
データ型 | テキスト |
サンプル名 | species_PREDICTION |
サンプル値 | lion |
説明 | 分類の予測ラベル |
予測クラスラベル(各クラス用) | |
---|---|
列名 | <target_name>_<class_label>_PREDICTION |
データ型 | 数値 |
説明 | 各クラスの浮動小数点での確率 |
分類の例 | |
---|---|
サンプル名 | サンプル値 |
species_cat_PREDICTION | 0.28 |
species_lion_PREDICTION | 0.24 |
species_lynx_PREDICTION | 0.48 |
時系列モデル¶
備考
これらの出力列は、時系列連続値、分類、異常検知モデルで使用できます。
時系列モデルの列 | 説明 | データ型 |
---|---|---|
<SERIES_ID_COLUMN_NAME> | 行が属する系列IDが含まれます。 これはパススルー列として機能し、変更されていない列名とスコアリングデータで提供された値を返します。 |
テキスト |
FORECAST_POINT | 予測ポイントのタイムスタンプが含まれます。 過去の時系列予測をリクエストしない限り、出力値は予測ポイントが同じで予測距離が異なるすべての行で同じになります。 |
日付 |
<TIME_COLUMN_NAME> | 時系列のタイムスタンプが含まれます。 これはパススルー列として機能するべきであり、変更されていない列名とスコアリングデータで提供された値を返します。 (これは、時系列モデルによって返される originalFormatTimestamp フィールドと同じ値を返します。) |
日付 |
FORECAST_DISTANCE | 時系列モデルによって返される予測距離の数値が含まれます。 | 数値 |
予測ステータス¶
予測ステータスラベル | |
---|---|
列名 | prediction_status |
データ型 | テキスト |
説明 | 予測が成功しなかった理由を説明する、`OK`または文字列エラーメッセージ を含む行ごとのステータス |
サンプル値 | 日付フィールドをYYYY-MM-DDの日付形式に変換できませんでした |
サンプル値 | OK |
予測警告¶
ジョブで予測警告が有効になっている場合、追加の列が返されます。
列名 | IS_OUTLIER_PREDICTION |
データ型 | テキスト |
説明 | 予測が計算済み予測境界の外側にあるかどうか |
値の例 | |
---|---|
列 | サンプル値 |
データ型 | テキスト |
IS_OUTLIER_PREDICTION | True |
IS_OUTLIER_PREDICTION | False |
デプロイ承認ステータス¶
デプロイの承認ワークフローが有効の場合、出力スキーマにはデプロイ承認ステータスを表示する追加列が含まれます。
デプロイステータスラベル | |
---|---|
列名 | DEPLOYMENT_APPROVAL_STATUS |
データ型 | テキスト |
説明 | デプロイが承認されたかどうか |
サンプル値 | PENDING |
予測の説明¶
maxExplanations
ジョブパラメーターをゼロ以外の値に設定すると、予測とともに返される予測の説明をリクエストできます。 説明を計算するしきい値も設定できます。 しきい値を設定しないと、DataRobotは各行の説明を計算します。
予測の説明パラメーター | |||
---|---|---|---|
ジョブパラメーター | 説明 | サンプル値 | データ型 |
maxExplanations | (オプション)この番号までの説明の計算。 | 10 | 整数 |
thresholdHigh | (オプション)説明をこのしきい値を超える予測に限定する。 | 0.5 | 浮動小数 |
thresholdLow | (オプション)説明をこのしきい値を以下の予測に限定する。 | 0.15 | 浮動小数 |
予測の説明が必要な場合、各説明で4つの追加列が「EXPLANATION_n
は、1から始まり、リクエストされた説明の最大数までの特徴量の説明インデックスです)。 戻り列は、以下のとおりです。
予測説明の列 | ||
---|---|---|
列 | 説明 | データ型 |
EXPLANATION_ |
この説明で扱う特徴量名。 | テキスト |
EXPLANATION_ |
浮動小数点数で表した特徴量の強さ。 | 数値 |
EXPLANATION_ |
文字列で表した特徴量の強さ。+++ から--- までのプラスまたはマイナスの指標。 |
テキスト |
EXPLANATION_ |
この説明に関連付けられた特徴量。 | テキスト |
予測説明の例¶
名前 | 値 |
---|---|
EXPLANATION_1_FEATURE_NAME | loan_status |
EXPLANATION_1_ACTUAL_VALUE | 原価償却済み |
EXPLANATION_1_STRENGTH | 1.380291221709652 |
EXPLANATION_1_QUALITATIVE_STRENGTH | +++ |
名前 | 値 |
---|---|
EXPLANATION_1_FEATURE_NAME | loan_status |
EXPLANATION_1_ACTUAL_VALUE | 完済 |
EXPLANATION_1_STRENGTH | -1.2145340858375335 |
EXPLANATION_1_QUALITATIVE_STRENGTH | --- |
パススルー列¶
リクエストしたパススルー列がそのまま渡されます。 上記の名前のいずれかと競合する場合、ジョブは拒否されます。
関連付けID¶
デプロイが精度の関連付けIDとともに設定された場合は、すべての結果セットにはソースデータから自動的に通過する列があります。
出力フィルター¶
以下のジョブ設定プロパティーを使用して、特定のクラス確率のみを表示するか、何も表示しないかを制御します。
出力フィルターパラメーター | |||
---|---|---|---|
ジョブパラメーター | 説明 | サンプル値 | データ型 |
includeProbabilities | (オプション)すべてのクラスの確率を含み、デフォルトはtrue です。 |
true | ブーリアン |
includeProbabilitiesClasses | (オプション)指定アレイにリスト表示された確率のみを含み、デフォルトは空アレイ[] です。 |
['setosa', 'versicolor'] | ブーリアン |
includePredictionStatus | (オプション)出力のprediction_status 列を含み、デフォルトはfalseです。 |
true | ブーリアン |
備考
二値分類の場合、includeProbabilities
はTHRESHOLD
と>POSITIVE_CLASS
列も制御します。
列名再マッピング¶
ユースケースにDataRobot出力と一致しない厳格な出力スキーマがある場合は、名前を変えて、columnNamesRemapping
ジョブ設定プロパティを使用して出力から任意の列を削除できます。
出力列再マッピングパラメーター | ||
ジョブパラメーター | 説明 | サンプル値 |
---|---|---|
columnNamesRemapping | (オプション)このジョブからの出力をリマップ(列の名前変更または削除)するアイテムのリストを指定します。列を無視するには、その列のoutputNameをNullまたはFalseに設定します。 | [{'inputName': 'isbadbuy_1_PREDICTION', 'outputName':'prediction'}, {'inputName': 'isbadbuy_0_PREDICTION', 'outputName': null}] |