時系列予測¶
時間の経過に伴って条件が変化する可能性があるデータサイエンスの問題がある場合、時間認識モデリングが推奨されます。 この方法では、モデルのトレーニングに使用した時間ウィンドウとは別の時間ウィンドウの観測値で検定セットが作成されます。 時間認識モデリングでは、単一の行での予測を作成することや、その時系列のコア機能で最近の履歴からパターンを抽出して将来の複数のイベントを予測することができます。
使用するタイミング¶
この方法は、以下の場合に使用します。
- データセットのサイズが10GBを超えている。
- 時系列予測は必要ないが、予測距離に基づく予測を行いたい。
- 完全に透過的な変換プロセスが望ましい。
使用方法¶
この方法を使用するには:
- 基本的な時間認識モデリングで説明されている設定のパーティション部分を実行します。
- 時系列モデリングを有効にする。
-
以下の図に示すようにオプション特徴量を設定します。
時系列モデリングを有効にする¶
以下のいずれかのオプションを使用して、時間認識予測や時系列モデリングを開始するエクスペリメントを作成できるトグルにアクセスします。
-
時間関連データの日付/時刻パーティション設定ページから時系列モデリング設定に移動を選択します。
-
エクスペリメントのサマリーパネルで時系列モデリングを選択します。
-
上部のタブで時系列モデリングを選択します。
どのオプションを選択しても、時系列モデリングタブの設定が開きます。 そこから、時系列モデリングを有効にするをオンに切り替えます。

設定は、データパーティショニングタブ(順序付け特徴量とバックテスト)から継承されます。 必要に応じて、参照して完了します。
時系列モデリングには、時系列エクスペリメントを設定するためのオプションセットが追加されています。
- 系列IDの設定(複数系列プロジェクトの場合)。
- ウィンドウ設定のカスタマイズ。
- その他のオプション機能の設定。
系列IDを設定¶
データで重複するタイムスタンプが検出された場合、DataRobotには 複数系列モデリングを設定するためのオプションがあります。 複数系列モデリングでは、重複するタイムスタンプを含むデータセットをモデル化できます。その場合、複数の個々の時系列データセットとして処理できます。 各行が属する系列を示す系列識別子を選択します。

ウィンドウ設定のカスタマイズ¶
DataRobotには、データセットの特性に基づいて、デフォルトのウィンドウ設定である特徴量派生ウィンドウ(FDW)と予測ウィンドウ(FW)の機能があります。 これらの設定は、特徴量派生処理に使用される 基本的なフレームワークを定義することによって、DataRobotがモデリングデータセットの特徴量を派生する方法を決定します。 通常、そのままにしておくことができます。

次の表では、画面のウィンドウ設定セクションの要素を簡単に説明します。
重要
これらの値を変更する場合は、各ウィンドウの意味と意味合いについて、 詳細なガイダンスを参照してください。
オプション | 説明 | |
---|---|---|
1 | 特徴量の派生ウィンドウ (FDW) | DataRobotがモデリングデータセットの 特徴量派生に使用するデータ期間を設定します。 |
2 | リストされた特徴量を派生から除外する | 時間ベースの特徴量エンジニアリングの自動化から特定の特徴量を除外します(独自の時間指向の特徴量を抽出し、その特徴量で追加の派生処理を実行しない場合など)。 オプションをオンに切り替え、ドロップダウンから特徴量を選択します。 |
3 | 予測ウィンドウ | 予測ポイントの後にモデルが出力する予測の時間範囲を設定します。 |
4 | ウィンドウの概要 | ウィンドウ設定をグラフィカルに表示します。 ウィンドウの値を変更すると、すぐに表示に反映されます。 |
その他のオプション機能の設定¶
オプションで3つのエクスペリメント設定を追加できます。

事前に既知の特徴量を設定を使用して、モデリング時に値が既知である特徴量を除外します。 このオプションで特徴量が識別された場合、モデリングデータを派生するときにラグは作成されません。 一部の変数が事前に既知であることを示し、予測時間を指定することにより、予測精度が大幅に向上します。 特徴量が既知としてフラグが付けられている場合、その将来の値は予測時に提供されなければなりません。 このオプションを使用するには、オンに切り替え、ドロップダウンから特徴量を選択します。
イベントカレンダーを含めるを使用し、さらなる注意が必要な日付やイベントを指定するイベントファイルのアップロードまたは生成を行います。 DataRobotはファイルを使用して、リストされたイベントに基づいて特徴量を自動的に作成します。 ローカルファイルまたはデータレジストリに保存されているファイルを選択できます。 または、カレンダーを生成をクリックして、選択した地域に基づいてイベントのファイルを生成します。

部分履歴をサポートするモデルをトレーニングは、系列の履歴が部分的にしかわからない場合(過去の行が特徴量派生ウィンドウ内で部分的に利用可能)、または系列がトレーニングデータで確認されていない場合に使用します。 選択すると、オートパイロットは過去の不完全なデータに対して最適化されたブループリントを実行します。これにより、部分的な履歴のサポートにおいて結果の精度が低いモデルが排除されます。
予測モデリングを開始¶
モデリング設定(エクスペリメントのサマリーに要約されています)に問題がないことを確認したら、モデリングを開始をクリックします。 モデリングプロセスが開始されると、DataRobotはターゲットを分析し、モデリングに使用する時間ベースの特徴量を作成します。 右パネルのキューから、エクスペリメントに適用されるワーカーの数をコントロールできます。 必要に応じて、エクスペリメントのためのワーカーを増減します。

そこから、実行中のジョブ、キューに入っているジョブ、失敗したジョブを見ることもできます。 必要に応じてキューを展開し、実行中のジョブや割り当てられたワーカーを確認してください。

必要に応じて、 トラブルシューティングのヒントセクションを参照してください。
次のアクション¶
モデリングを開始すると、DataRobotでリーダーボードにモデルが入力されます。 以下を実行することが可能です。
- 使用可能なモデルで モデル評価を開始します。
- エクスペリメント情報を表示オプションを使用すると、モデルに関するさまざまな情報を表示できます。
- モデルの構築に使用されたデータである派生モデリングデータを表示します。

派生したモデリングデータの詳細については、以下のセクションを参照してください。