時系列¶
時系列モデルのバッチ予測は、追加の設定なしで機能します。 ただし、ほとんどの場合はデフォルト設定を変更するか、予測データセットを準備する必要があります。
時系列バッチ予測の設定¶
デフォルト設定は、timeseriesSettings
ジョブ設定プロパティを使用してオーバーライドできます。
パラメーター | 例 | 説明 |
---|---|---|
type |
forecast |
forecast (デフォルト)またはhistorical のいずれかである必要があります。 |
forecastPoint |
2019-02-04T00:00:00Z |
(オプション)デフォルトで、DataRobotはデータセットから予想ポイントを推測します。 設定するには、type をforecast に設定する必要があります。 |
predictionsStartDate |
2019-01-04T00:00:00Z |
(オプション)デフォルトで、DataRobotはデータセットから開始日を推測します。 設定するには、type をhistorical に設定する必要があります。 |
predictionsEndDate |
2019-02-04T00:00:00Z |
(オプション)デフォルトで、DataRobotはデータセットから終了日を推測します。 設定するには、type をhistorical に設定する必要があります。 |
relaxKnownInAdvanceFeaturesCheck |
false |
(オプション)アクティブ化すると、事前に既知の欠損値特徴量を予測時に予想ウィンドウで使用できます。 省略するかfalse の場合、欠損値は使用できません。 デフォルト:false 。 |
完全なジョブの例を以下に示します。
{
"deploymentId": "5f22ba7ade0f435ba7217bcf",
"intakeSettings": {"type": "localFile"},
"outputSettings": {"type": "localFile"},
"timeseriesSettings": {
"type": "historical",
"predictionsStartDate": "2020-01-01",
"predictionsEndDate": "2020-03-31"
}
}
Python SDKを使用した例:
import datarobot as dr
dr.Client(
endpoint="https://app.jp.datarobot.com/api/v2",
token="...",
)
deployment_id = "..."
input_file = "to_predict.csv"
output_file = "predicted.csv"
job = dr.BatchPredictionJob.score_to_file(
deployment_id,
input_file,
output_file,
timeseries_settings={
"type": "historical",
"predictions_start_date": "2020-01-01",
"predictions_end_date": "2020-03-31",
},
)
print("started scoring...", job)
job.wait_for_completion()
予測タイプ¶
forecast
モードを使用する場合は、DataRobotはターゲットなしで、データセットのforecastPoint
または行を使用して予測します。 historical
モードの場合は、DataRobotは一括予測を有効化し、predictionsStartDate
とpredictionsEndDate
の範囲内の可能なすべての予想ポイントと予想距離を予測します。
スコアリングデータセットの要件¶
バッチ予測APIで時系列データセットを処理するには、以下を設定する必要があります。
- 予測行をタイムスタンプでソートします。最も古い行が最初に表示されます。
- 複数系列を使用する場合、予測行は系列ID、次にタイムスタンプでソートする必要があります。
- DataRobotがサポートする系列の数には制限はありません。 制限に記載されているように、唯一の制限はジョブのタイムアウトです。
単一系列の予測データセットの例¶
単一系列の予測データセットの例を以下に示します。
日付 | y |
---|---|
2020-01-01 | 9342.85 |
2020-01-02 | 4951.33 |
24の追加の過去の行 | |
2020-01-27 | 4180.92 |
2020-01-28 | 5943.11 |
2020-01-29 | |
2020-01-30 | |
2020-01-31 | |
2020-02-01 | |
2020-02-02 | |
2020-02-03 | |
2020-02-04 |
複数系列予測データセット例¶
複数の系列をスコアリングする場合、データは系列とタイムスタンプでソートする必要があります。
日付 | 系列 | y |
---|---|---|
2020-01-01 | A | 9342.85 |
2020-01-02 | A | 4951.33 |
24の追加の過去の行 | ||
2020-01-27 | A | 4180.92 |
2020-01-28 | A | 5943.11 |
2020-01-29 | A | |
2020-01-30 | A | |
2020-01-31 | A | |
2020-02-01 | A | |
2020-02-02 | A | |
2020-02-03 | A | |
2020-02-04 | A | |
2020-01-01 | B | 8477.22 |
2020-01-02 | B | 7210.29 |
24の追加の過去の行 | ||
2020-01-27 | B | 7400.21 |
2020-01-28 | B | 8844.71 |
2020-01-29 | B | |
2020-01-30 | B | |
2020-01-31 | B | |
2020-02-01 | B | |
2020-02-02 | B | |
2020-02-03 | B | |
2020-02-04 | B |
更新しました August 26, 2024
このページは役に立ちましたか?
ありがとうございます。どのような点が役に立ちましたか?
より良いコンテンツを提供するには、どうすればよいでしょうか?
アンケートにご協力いただき、ありがとうございました。