時系列 (V7.1)¶
2021年6月14日
DataRobot v7.1.0リリースには、以下に示す多くの新しい時系列機能が含まれています。詳細については、その他のAutoML新機能も参照してください。
新しい時系列機能¶
新機能の詳細については、以下を参照してください。
- 新しいバッジは、時系列プロジェクトのベースラインモデルを識別します
- 時系列カレンダーの改善
- EWMA設定は最近のデータからより多くを学習します
- 精度を高めるためにデフォルトから非同期パーティショニング
- ベータ:データ準備の改善
- ベータ機能:コールドスタートと部分的な履歴のブループリント
- ベータ:新しい系列の信頼性ルール
新しいバッジは、時系列プロジェクトのベースラインモデルを識別します¶
DataRobotは、リーダーボードにバッジが付いた時系列プロジェクトのベースラインモデルとして使用されているモデルを識別するようになりました。
ベースラインモデルは、最長の周期性に一致する最新の値を使用するモデルです。プロジェクトには異なる周期性のある複数のナイーブ予測がある場合がありますが、DataRobotは最長のナイーブ予測を使用してMASEスコアを計算します。
MASEは予測の精度の指標で、ナイーブベースラインモデルに対する1つのモデルの比較です。これは、選択可能な多くの最適化指標の1つです。このリリースでは、指標のドロップダウンからドキュメントへのアクセスも導入されています。
時系列カレンダーの改善¶
このリリースでは、DataRobotはカレンダーの改善を提供し、サイズ制限とAIカタログの柔軟性が高まります。現在、DataRobotは、時系列プロジェクトで使用するカレンダーで最大10 MBのファイルサイズをサポートしています。さらに、ローカルファイルとしてアップロードされたカレンダーは、AIカタログに自動的に追加されます。ファイルがカタログにある場合、それらを表示してプロジェクトで使用できます。または、それらをダウンロードして、編集して再アップロードすることなどが可能です。DataRobotでカレンダーを生成し、ダウンロードしてカスタマイズし、AIカタログに再アップロードできるため、生成されたカレンダーに特に役立ちます。いずれの場合も、任意のカレンダーファイルを組織内の他のユーザーと共有できます。
EWMA設定は最近のデータからより多くを学習します¶
このリリースでは、[高度なオプション]リンクから利用できる指数加重移動平均(EWMA)の設定が導入されています。これは、指数加重移動平均操作を特徴量に適用します。EWMAは、最新のデータポイントに大きな加重と重要性を置き、時間の経過に伴うトレンドの方向を測定し、新しい値が古い値よりも分散に大きな影響を与えるようにします。
ベータ:データ準備の改善¶
リリース 7.0では、時間ベースモードでギャップの処理を行うベータ機能が導入され、不規則な時間ステップのデータセットが使用できるようになりました。このリリースでは、開始画面とAIカタログの両方からツールにアクセスできるようにするなどの機能が改善されています。
精度を高めるためにデフォルトから非同期パーティショニング¶
時系列v6.3プロジェクトでは、非同期パーティション分割はオプションの機能でしたが、デフォルトの動作になりました。これにより、重要なイベントを十分に網羅し、データを表現できるようにバックテストが自動的に調整されるようになり、単純にデータの長さに基づいて生成されることはなくなりました。その代わり、ターゲットに合わせたカスタマイズが可能になり、特定の関心領域(季節的なイベント、休日、定期的な異常など)を強調したり含めたりすることができるようになりました。この機能では、バックテストの対象が不十分な可能性がある領域を特定し、トレーニングパーティションと検証パーティションの境界を自動的に調整することによって、各バックテストでサンプリングされるデータを改善することができます。バックテストの開始日と終了日を手動でカスタマイズできる以前の機能は引き続き利用できます。
ベータ機能:コールドスタートと部分的な履歴のブループリント¶
「コールドスタート」は、トレーニングデータには見られなかった系列をモデル化する機能です。部分履歴とは、部分的にしか知られていない系列履歴を持つ予測データセットを指します(履歴行は特徴量派生ウィンドウ内で部分的に利用可能です)。一部のブループリントは、いくつかの履歴を考慮して新しい系列を予測するように設計されていますが、そうでないものもあります。これは次善の予測につながる可能性があるため、完全な履歴が指定されていない系列の予測を行う際にはDataRobotはエラーになります。(特定の予測ポイントの特徴量を派生させるには、完全な履歴が必要でした)このリリースで、時系列に、コールドスタートと部分的な履歴モデリング向けに最適化されたブループリントが導入されています。新しいブループリントはオートパイロットの一部として実行され、複数系列の連続値プロジェクトで利用できます。
部分的な履歴データセットをサポートするモデルを含めるように高度なオプションを設定します。
ベータ機能:「新しい系列」の信頼性ルール¶
新しい系列の信頼性ルールがv7.0.0で導入され、トレーニングデータでは見られなかった系列をトリガーとするルールが作成できます。今回のリリースでは、ベータ機能として利用可能であり、リーダーボードから設定するのではなく、モデルレジストリでモデルを置換するように信頼性ルールを設定できるようになりました。これにより、モデルが特定のプロジェクトから切り離され、モデルパッケージを使用できるようになります。互換性のあるプロジェクトのバックアップモデルを使用すると、柔軟性が向上します(互換とは、使用されるターゲット、日付/時刻のパーティション列、特徴量派生ウィンドウ、予測距離、系列名などが同じであるという意味です)。この機能を使用するにはMLOpsへのアクセスが必要です。
時系列の問題の修正¶
7.0.2以降のリリースでは、以下の問題が修正されています。
時系列¶
-
TIME-7599:プロジェクトの作成後、特徴量派生処理を開始する前にデータセットが削除されると、カタログデータセットを使用する時系列プロジェクトが失敗していた問題を修正しました。
-
TIME-7800:Eureqa GAMモデルのモデルエクスポートの不具合を修正しました。
-
TIME-7847:予測APIで起動した時系列一括予測の予測の説明の計算を修正しました。
-
TIME-8176:新しい系列モデラーを使用した一部のケースで、予測の説明の計算に失敗する問題を修正しました。
-
TIME-8425:バックテスト0がフィルタリング条件として指定されている場合、異常評価レコードルートが出力を適切にフィルタリングするようになりました。