ワークフローの概要:時系列モデルを構築します¶
開始するには、時系列データセット要件を満たすデータセットをアップロードします。DataRobotのデータ品質評価はデータセットで不規則な時間ステップを検出した場合、時系列データ準備ツールを使用して問題を修正できます。
DataRobotで1つ以上の時間特徴量が検出された場合、時間認識モデリングの機能がアクティブになります。一般的なワークフローを以下に示しますが、日付/時刻モデリングの追加情報については、詳細ページを参照してください。
備考
データに日付/時刻特徴量が含まれていても、データに不規則な時間単位や一意でないタイムスタンプが含まれる場合、時系列予測モードは無効化されることがあります。潜在的なソリューションについては、時系列データ準備ツールを説明するセクションを参照してください。
ターゲット特徴量を設定した後:
-
時間認識モデルを設定リンクをクリックします。
-
ドロップダウンから日付/時刻特徴量を選択します。
-
適用する時間認識アプローチを選択します。
- データが時間に関連するものであっても、予測は行わずに、個々の各行のターゲット値を予測する場合、Automated Machine Learning(OTV)を使用します。このアプローチは、単一のイベントデータ(患者の入院や不良債務など)がある場合に使用します。
- ターゲットの複数の将来値を予測する場合に自動時系列予測を使用します(翌週の各日の売り上げの予測など)。このアプローチは、連続する一連の値の将来値を推定する場合に使用します。
- モデリングを使用して現在の値を決定する場合、自動時系列ナウキャスティングを使用します。
-
時系列を選択したときに系列データがDataRobotで検出された場合、複数系列モデリングの系列IDを設定します。
-
予測ウィンドウ(特徴量の派生ウィンドウ(FDW))および予測ウィンドウ(FW)をカスタマイズして、モデリングデータセットの特徴量を派生させる方法を設定します。以下のことを考慮してください。
- Data Prepツールを使用する。
- 特徴量を事前に既知に設定する(予測を作成する場合にラグなしで使用します)。
- カレンダーファイルを含める。
-
モデリングに使用する設定(日付/時刻形式、トレーニングウィンドウ、検定の長さなど)を変更するには、下にスクロールして高度なオプションを表示を展開します。詳細については、完全なドキュメントを参照してください。
複数系列の系列識別子を変更するには、時系列の高度なオプションを開きます。
-
設定したら、モデリングモードを選択し開始を押します。
モデリングプロセスが開始すると、DataRobotはターゲットを分析し、時系列ベストプラクティスを実行します。DataRobotは、さまざまなブループリントで使用する時間ベースの特徴量も作成します。以下の操作を検討してください。
- データタブで特徴量をドリルダウンして、分布とトレンドを表示します。
- モデリングに使用する時系列特徴量セットを操作します。
- 予測プレビューを使用して、予測を確認し、値をダウンロードし、予測間隔で「信頼性」要素を可視化します。
モデルの調査¶
モデルが構築されると、リーダーボードから以下のタブを使用してモデルを評価に活用できます。
タブ | 場所 |
---|---|
時系列の精度 | OTV:時系列および複数系列の追加オプション |
予測値と実測値の比較 | 時系列、複数系列 |
系列のインサイト | 複数系列 |
安定性 | OTV、時系列、複数系列 |
予測距離ごとの精度 | 時系列、複数系列 |
時間経過に伴う異常 | 異常検知:OTV、時系列、複数系列 |
異常評価 | 異常検知:時系列、複数系列 |