Skip to content

時間認識エクスペリメントの作成

時間認識モデリングは、分割手法として日付/時刻に基づいています。 教師あり学習では、データセットの他の特徴量を使用して予測を行います。 これに対して、教師なし学習では、ラベル付けされていないデータを使用して、データのパターンに関するインサイトを明らかにします。

以下のタイプの時間認識モデリングが利用可能です。 すべての教師あり学習方法において、エクスペリメントを作成するには基本設定を使用します。

タイプ 説明 使用状況
時間認識予測 (教師あり) バックテストに時系列で行を割り当て、1行ずつ予測します。 特徴量エンジニアリングは提供しません。 時系列予測が不要な場合に使用します。
特徴量変換を用いた時間認識予測(教師あり) 予測距離ごとに行を割り当て、各距離に別個のモデルを構築してから、1行ずつ予測します。 時間認識ラングリングと組み合わせることを推奨します。これにより、透過的で柔軟な特徴量エンジニアリングが可能になります。 以下の場合に使用します。
  • 時系列予測は必要ないが、予測距離に基づく予測を行いたい。
  • データセットのサイズが10GBを超えている。
  • 完全に透過的な変換プロセスが望ましい。
時系列予測(教師あり) DataRobotの自動化された特徴量派生プロセスを使用して、ターゲットの複数の将来値を予測し、時系列モデリングデータセットを作成します。 以下の場合に使用します。
  • データセットのサイズが10GBより小さい
  • すべての特徴量について、前処理 -> 抽出 -> 後処理という完全な変換プロセスが必要である。
教師なしエクスペリメントのセットアップ データのパターンに関するインサイトを明らかにしたり、異常検知によって外れ値を特定したりするクラスタリングモデルを構築します。 ターゲットを指定せずに使用します。

備考

時間認識モデリングの基礎について、豊富な資料を用意しています。 これらの手順は主にDataRobot Classicで適用されるワークフローを表していますが、時系列予測のフレームワーク特徴量派生プロセスなどを説明する参照資料も引き続き利用できます。

機能に関する注意事項

ワークベンチで日付/時刻パーティションプロジェクトを処理する場合は、次の点に注意してください。

  • 派生した特徴量には特徴量セットを作成できません。
  • モデル比較はサポートされていません。
  • Eureqaモデルのインサイトは使用できません。