Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

時系列フレームワーク

シンプルな時系列モデリングのフレームワークは、次のように表現できます。

  • 予測ポイントは、予測を作成する任意の時間ポイントを定義します。
  • 予測ポイントの左にある特徴量の派生ウィンドウ(FDW)は、DataRobotでモデリングデータセットの新しい特徴量を派生させるために使用されるデータのローリングウィンドウを定義します。
  • 最後に、予測ポイントの右にある予測ウィンドウ(FW)は、予測する将来値の範囲(予測距離(FD))を定義します。DataRobotは、この予測ウィンドウを基に「このウィンドウ内の各日の予測」を作成します。

予測ウィンドウで指定した範囲には、指定した値も含まれます。例えば、+2 日から+ 7 日と設定した場合、ウィンドウには 2、3、4、5、6、7 日目が含まれます。それに対して、特徴量の派生ウィンドウには、左側の境界が含まれませんが右側の境界が含まれます。(上記のイメージでは、DataRobotは7日前から27日前に7日間、28日以降に使用します。)左側(古い方)では排他的ラグが設定され、右側(新しい方)では包含的ラグが設定されるので、これの点はウィンドウを設定する際に注意する必要があります。差分特徴量セットを予測時に使用する場合、差分を考慮する必要があります。たとえば、モデルで7日の差分を使用し、特徴量の派生ウィンドウの間隔が[-28~0]日である場合、有効な派生ウィンドウは、[-35~0]日です。

時系列フレームワークは、新しい予測を作成するために必要な最近の履歴の量をエンコードすることによって、モデルの使用方法のビジネスロジックを取り込みます。最近の履歴を設定すると、特徴量、予測ポイント、そして最終的に予測に使用するローリングウィンドウが設定されます。言い換えれば、特徴量の作成プロセスの最小の制約と予測の作成に必要な最小の履歴が設定されます。

上記のフレームワームで、この例では28日前から7日前までのデータが使用されます。モデルがレポートする予測距離は、2から7日目です。予測には、これらの各日に対して1行が含まれます。予測ウィンドウは、トレーニングに使用するモデルの全体的な精度を測定する客観的な方法を提供します。この場合、合計誤差は、データのすべての潜在的な予測ポイントとウィンドウの各予測距離の精度を平均化することによって算出されます。

次に、時系列特有の問題であるギャップを追加します。

この図には、ブラインド履歴ギャップ(BHG)運用不可ギャップ(COG)が含まれます。

BHGは最新のデータへのアクセスの遅延によって生じたギャップをキャプチャします(例えば、「最新」は常に1週間前である可能性があります)。BHGは、特徴量の派生ウィンドウに入力された値のうちの小さい方の値です。ギャップがゼロの場合、「今日までのデータと今日のデータを使用」を意味し、1のギャップは「昨日から始まるデータを使用」を意味し、その後は同様に続きます。

「Can't Operationalize Gap」(運用不可ギャップ)は予測ポイントの直後に発生します。これは、短期すぎて使用できない期間です。たとえば、明日の人員の需要予測は、その予測に対するアクションを実施するには遅すぎることがあります。


更新しました February 22, 2022
Back to top