時系列 (V7.2)¶
2021年9月13日
DataRobot v7.2.0リリースには、以下の多くの新しい時系列機能が含まれています。リリース7.2.0の詳細については、AutoMLおよびMLOpsリリースノートもご参照ください。
新しい時系列機能¶
以下の一般提供された新機能の詳細をご覧ください:
以下のパブリックプレビュー新機能の詳細をご参照ください:
一般提供されている機能¶
以下の新機能が一般提供されました。
現在の値を予測するNowcasting¶
GA機能として利用可能なnowcastingは、過去と現在のデータに基づいてターゲットの現在の値を予測する時系列モデリングの方法です。開始時刻と終了時刻が0(現在)の予測ウィンドウです。つまり、現在の入力値と最近の履歴に基づいて、今のターゲットは何になるのか。(これに対して予測は、過去と現在のデータをもとに未来の値を予測するものです。)リリース7.2では、プロジェクト開始時にnowcastingが選択される際に、予測開始および終了時刻に対してDataRobotは予測ウィンドウ(FW)設定を自動的に[0、0]に適用します。さらに、FDW(特徴量派生ウィンドウ)側は、現在のタイムステップよりも1つ前のタイムステップで設定されており、ターゲットリーケージリスクを冒すことなく、ターゲットに対する追加の特徴量を派生することができます。
詳細については、ナウキャスティングを参照ください。
オートパイロットで部分履歴ブループリントを実行する¶
これまでパブリックプレビュー機能として提供されていた、予測の部分的履歴を許可する詳細オプションが、一般提供に向けて強化されました。現在、オートパイロットが実行するモデルの数は約40%減少し、部分的に履歴が残っている場合に精度の低い結果を出すモデルが排除されています。有効化されていれば、オートパイロットは新しい系列のブループリントにも対応します。さらに、この機能は以下もサポートするようになりました:
- 単一系列プロジェクト
- 行ベースモードのモデル
- 分類プロジェクト
- 「ターゲットを派生しない」プロジェクトが有効になりました。
詳細については、時系列の高度なオプションをご参照ください。
外部モデルの比較の改善¶
ベースライン精度の比較のサポートにより、DataRobot以外の時系列モデルから取得した予測値をアップロードし、それをDataRobot時系列モデルの予測値と比較することができます。パブリックプレビューバージョンの改良により、特徴量は複数の予測距離を指定できるようになり、またAPIにも対応するようになりました。外部のベースライン(アップロードされた予測値)に合わせてスケーリングするように既存のメトリクスが再設計され、リーダーボードから一目でわかる精度測定と比較ができるようになりました。
詳細については、外部予測比較をご参照ください。
特徴量のインパクトから冗長な機能を削除¶
以前はAutoMLでのみ利用可能でしたが、DataRobotでは時系列プロジェクトで特徴量のインパクトを計算する際に、特徴量の冗長性チェックを実行するようになり、冗長な特徴量を取り除くオプションを提供しています。これは、モデルの最も重要な特徴量に基づいて1つまたは複数の特徴量セットを作成したい場合に重要です。時系列プロジェクトにとって重要であれば、インパクトの最も強い一部のナイーブ特徴量が維持される場合がありますのでご注意ください。
詳細については、特徴量のインパクトに関するドキュメントをご参照ください。
新しい系列の信頼性ルール¶
現在は一般提供されている機能として、リーダーボードの代わりにモデルレジストリから置換モデルを使用する信頼性ルールを設定することができるようになりました。これにより、モデルが特定のプロジェクトから切り離され、モデルパッケージを使用できるようになります。互換性のあるプロジェクトのバックアップモデルを使用すると、柔軟性が向上します(互換とは、使用されるターゲット、日付/時刻のパーティション列、特徴量派生ウィンドウ、予測距離、系列名などが同じであるという意味です)。この機能を使用するにはMLOpsへのアクセスが必要です。
詳細については、複数系列の信頼性ルールをご参照ください。
パブリックプレビュー機能¶
以下の機能はパブリックプレビュープログラムの一部です。
時系列データ準備ツール¶
時系列の開始ページまたはAIカタログ内のいずれからもアクセスできるバージョン7.2の時系列データ準備ツールには、3つの大幅な改良が加えられています。
-
数値とカテゴリーだけでなく、テキストで示されたターゲット特徴量に関する特徴量の集計と補完。
-
目標値の50%以上が補完された場合に警告を行うガードレール(モデルの精度に影響を与える可能性があります)。
-
リーダーボードから予測データセットにデータの準備変換を適用する機能。
派生時に削除された機能の復元¶
時系列機能の一環として、DataRobotは派生する特徴量を生成した後に特徴量削減アルゴリズムを実行し、影響度が低いことが検出された特徴量を削除します。しかし、生成された特徴量セットに含めたい特徴量や、特徴量のインパクトの評価が望まれる特徴量が存在する可能性もあります。今回のリリースでは、EDA2が完了した後で、これらの特徴量を利用可能な派生モデリングデータに追加し、それらを含む新しい特徴量セットを作成することができます。
高解像度カレンダー¶
カレンダーのイベントに関連する特徴量を、より詳細なタイムスタンプベースのレベルで派生させることが可能になりました。一日の始まりではなく、タイムスタンプから開始することにより、朝の午前9:30から午前11:30まで続くプロモーションセールなど、特定のカレンダーイベントの効果を取り込むことができます。さらに、期間を指定して、イベントの真陰性率をさらに強調することができるようになりました。精度を確保するために、DataRobotは重複するカレンダーイベントに基づいてカレンダーから派生する特徴量をサポートするガードレールを提供します。
時系列のスコアリングコード¶
パブリックプレビューで利用可能になりました。Javaベースのスコアリングコードパッケージで時系列モデルをエクスポートできます。スコアリングコードは、DataRobotアプリケーションの外でDataRobotモデルを利用するためのポータブルで低レイテンシーな方法です。以下のブループリントでは、スコアリングコードが生成されることがあります。
- 固定エラー条件を含むAUTOARIMA
- ElasticNetリグレッサー(L2 / Gamma Deviance)
- ElasticNetリグレッサー(L2 / Poisson Deviance)
- Eureqa一般加法モデル
- eXtreme Gradient Boosted Treesリグレッサー
- Early Stopping搭載のGradient Boosted Treesリグレッサー
- ElasticNet予測でのeXtreme Gradient Boosting
- ElasticNet予測でのLight Gradient Boosting
- 予測距離モデリングを使用する、パフォーマンスクラスター化されたElastic Netリグレッサー
- Elastic Net予測でのパフォーマンスクラスター化されたeXtreme Gradient Boosting
- RandomForestリグレッサー
- 線形的に減退するウェイトを使用する予測距離モデリング付きのRidgeリグレッサー
- 予測距離モデリング付きのRidgeリグレッサー
- 固定エラー条件を伴うベクター自己回帰モデル(VAR)
現在、以下の機能が網羅されています。
- カレンダー(非高解像度)
- 交差系列
- ゼロ過剰/ナイーブ二値
- ナウキャスティング(履歴範囲予測)
- ブラインド履歴ギャップ
時系列の問題の修正¶
リリース7.1.0以降で以下の問題が解決されています。
-
TIME-8176:新しい系列モデラーで予測の説明が計算に失敗する問題が修正されました。
-
TIME-8425:バックテスト0がフィルタリング条件として指定されている場合に、異常評価レコードが適切にフィルタリングされるようになりました。
-
TIME-8992:KIAの新しい系列モデラーのカスタム特徴量セットの問題が修正されました。
-
TIME-9074:検定の実行に必要な最小行数が正しくないために、有効な予測ポイント範囲の計算でエラーが発生していた問題を修正しました。