Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

時系列

時系列モデルのバッチ予測は、追加の設定なしで機能します。ただし、ほとんどの場合はデフォルト設定を変更するか、予測データセットを準備する必要があります。

備考

時系列のバッチ予測は、交差系列プロジェクトや従来の時系列モデル(ARIMAなど)では使用できません。

時系列バッチ予測の設定

デフォルト設定は、timeseriesSettingsジョブ設定プロパティを使用してオーバーライドできます。

パラメーター 説明
type forecast forecast(デフォルト)またはhistoricalのいずれかである必要があります。
forecastPoint 2019-02-04T00:00:00Z オプション。デフォルトで、 DataRobot はデータセットから予想ポイントを推測します。設定するには、typeforecastに設定する必要があります。
predictionsStartDate 2019-01-04T00:00:00Z オプション。デフォルトで、 DataRobot はデータセットから開始日を推測します。設定するには、typehistoricalに設定する必要があります。
predictionsEndDate 2019-02-04T00:00:00Z オプション。デフォルトで、 DataRobot はデータセットから終了日を推測します。設定するには、typehistoricalに設定する必要があります。
relaxKnownInAdvanceFeaturesCheck false オプション。アクティブ化すると、予測時の予想ウィンドウで、事前に既知の特徴量に対して欠損値を用いることが許可されます。省略するか、falseの場合、欠損値は使用できません。デフォルト: false

完全なジョブの例を以下に示します。

{
    "deploymentId": "5f22ba7ade0f435ba7217bcf",
    "intakeSettings": {"type": "localFile"},
    "outputSettings": {"type": "localFile"},
    "timeseriesSettings": {
        "type": "historical",
        "predictionsStartDate": "2020-01-01",
        "predictionsEndDate": "2020-03-31"
    }
}

Python SDKを使用した例:

import datarobot as dr

dr.Client(
    endpoint="https://app.datarobot.com/api/v2",
    token="...",
)

deployment_id = "..."

input_file = "to_predict.csv"
output_file = "predicted.csv"

job = dr.BatchPredictionJob.score_to_file(
    deployment_id,
    input_file,
    output_file,
    timeseries_settings={
        "type": "historical",
        "predictions_start_date": "2020-01-01",
        "predictions_end_date": "2020-03-31",
    },
)

print("started scoring...", job)
job.wait_for_completion()

予測タイプ

forecastモードを使用する場合は、DataRobotはターゲットなしで、データセットのforecastPointまたは行を使用して予測します。historicalモードの場合は、DataRobotは一括予測を有効化し、predictionsStartDatepredictionsEndDateの範囲内の可能なすべての予想ポイントと予想距離を予測します。

スコアリングデータセットの要件

バッチ予測APIで時系列データセットを処理するには、以下を設定する必要があります。

  • 予測行をタイムスタンプでソートします。最も古い行が最初に表示されます。
    • 複数系列を使用する場合、予測行は系列ID、次にタイムスタンプでソートする必要があります。
  • 予測をリクエストする場合、データセットには、目的の予測ウィンドウのターゲットのない行が含まれている必要があります
  • DataRobotがサポートする系列の数には制限はありません制限に記載されているように、唯一の制限はジョブのタイムアウトです。

単一系列の予測データセットの例

単一系列の予測データセットの例を以下に示します。

日付 y
2020-01-01 9342.85
2020-01-02 4951.33
24の追加の履歴行
2020-01-27 4180.92
2020-01-28 5943.11
2020-01-29
2020-01-30
2020-01-31
2020-02-01
2020-02-02
2020-02-03
2020-02-04

複数系列予測データセット例

複数の系列をスコアリングする場合、データは系列とタイムスタンプでソートする必要があります。

日付 系列 y
2020-01-01 A 9342.85
2020-01-02 A 4951.33
24の追加の履歴行
2020-01-27 A 4180.92
2020-01-28 A 5943.11
2020-01-29 A
2020-01-30 A
2020-01-31 A
2020-02-01 A
2020-02-02 A
2020-02-03 A
2020-02-04 A
2020-01-01 B 8477.22
2020-01-02 B 7210.29
24の追加の履歴行
2020-01-27 B 7400.21
2020-01-28 B 8844.71
2020-01-29 B
2020-01-30 B
2020-01-31 B
2020-02-01 B
2020-02-02 B
2020-02-03 B
2020-02-04 B

更新しました April 15, 2022
Back to top