時系列¶
時系列モデルのバッチ予測は、追加の設定なしで機能します。 ただし、ほとんどの場合はデフォルト設定を変更するか、予測データセットを準備する必要があります。
時系列バッチ予測の設定¶
デフォルト設定は、timeseriesSettingsジョブ設定プロパティを使用してオーバーライドできます。
| パラメーター | 例 | 説明 |
|---|---|---|
type |
forecast |
forecast(デフォルト)またはhistoricalのいずれかである必要があります。 |
forecastPoint |
2019-02-04T00:00:00Z |
(オプション)デフォルトで、DataRobotはデータセットから予想ポイントを推測します。 設定するには、typeをforecastに設定する必要があります。 |
predictionsStartDate |
2019-01-04T00:00:00Z |
(オプション)デフォルトで、DataRobotはデータセットから開始日を推測します。 設定するには、typeをhistoricalに設定する必要があります。 |
predictionsEndDate |
2019-02-04T00:00:00Z |
(オプション)デフォルトで、DataRobotはデータセットから終了日を推測します。 設定するには、typeをhistoricalに設定する必要があります。 |
relaxKnownInAdvanceFeaturesCheck |
false |
(オプション)アクティブ化すると、事前に既知の欠損値特徴量を予測時に予想ウィンドウで使用できます。 省略するかfalseの場合、欠損値は使用できません。 デフォルト:false。 |
完全なジョブの例を以下に示します。
{
"deploymentId": "5f22ba7ade0f435ba7217bcf",
"intakeSettings": {"type": "localFile"},
"outputSettings": {"type": "localFile"},
"timeseriesSettings": {
"type": "historical",
"predictionsStartDate": "2020-01-01",
"predictionsEndDate": "2020-03-31"
}
}
Python APIクライアントの使用例:
import datarobot as dr
dr.Client(
endpoint="https://app.datarobot.com/api/v2",
token="...",
)
deployment_id = "..."
input_file = "to_predict.csv"
output_file = "predicted.csv"
job = dr.BatchPredictionJob.score_to_file(
deployment_id,
input_file,
output_file,
timeseries_settings={
"type": "historical",
"predictions_start_date": "2020-01-01",
"predictions_end_date": "2020-03-31",
},
)
print("started scoring...", job)
job.wait_for_completion()
予測タイプ¶
forecastモードを使用する場合は、DataRobotはターゲットなしで、データセットのforecastPointまたは行を使用して予測します。 historicalモードの場合は、DataRobotは一括予測を有効化し、predictionsStartDateとpredictionsEndDateの範囲内の可能なすべての予想ポイントと予想距離を予測します。
スコアリングデータセットの要件¶
バッチ予測APIで時系列データセットを処理するには、以下を設定する必要があります。
- 予測行をタイムスタンプでソートします。最も古い行が最初に表示されます。
- 複数系列を使用する場合、予測行は系列ID、次にタイムスタンプでソートする必要があります。
- DataRobotがサポートする系列の数には制限はありません。 制限に記載されているように、唯一の制限はジョブのタイムアウトです。
単一系列の予測データセットの例¶
単一系列の予測データセットの例を以下に示します。
| 日付 | y |
|---|---|
| 2020-01-01 | 9342.85 |
| 2020-01-02 | 4951.33 |
| 24の追加の過去の行 | |
| 2020-01-27 | 4180.92 |
| 2020-01-28 | 5943.11 |
| 2020-01-29 | |
| 2020-01-30 | |
| 2020-01-31 | |
| 2020-02-01 | |
| 2020-02-02 | |
| 2020-02-03 | |
| 2020-02-04 | |
複数系列予測データセット例¶
複数の系列をスコアリングする場合、データは系列とタイムスタンプでソートする必要があります。
| 日付 | 系列 | y |
|---|---|---|
| 2020-01-01 | A | 9342.85 |
| 2020-01-02 | A | 4951.33 |
| 24の追加の過去の行 | ||
| 2020-01-27 | A | 4180.92 |
| 2020-01-28 | A | 5943.11 |
| 2020-01-29 | A | |
| 2020-01-30 | A | |
| 2020-01-31 | A | |
| 2020-02-01 | A | |
| 2020-02-02 | A | |
| 2020-02-03 | A | |
| 2020-02-04 | A | |
| 2020-01-01 | B | 8477.22 |
| 2020-01-02 | B | 7210.29 |
| 24の追加の過去の行 | ||
| 2020-01-27 | B | 7400.21 |
| 2020-01-28 | B | 8844.71 |
| 2020-01-29 | B | |
| 2020-01-30 | B | |
| 2020-01-31 | B | |
| 2020-02-01 | B | |
| 2020-02-02 | B | |
| 2020-02-03 | B | |
| 2020-02-04 | B | |