時系列(V9.0)¶
次の表は、新機能の一覧です。
一般提供¶
クイックオートパイロットの改善を時系列に適用¶
このリリースでは、クイックオートパイロットが時系列プロジェクト向けに効率化され、エクスペリメントがスピードアップしました。 新バージョンのクイックオートパイロットでは、実行時の効率を最大限に高めるために、特徴量を削減した特徴量セットの自動生成とフィッティングが行われなくなりました。フィッティングにはモデルの再トレーニングが必要であるためです。 モデルは、プロジェクトの日時パーティションで定義された、各バックテストの最大サンプルサイズで引き続きトレーニングされます。 モデルの具体的な実行回数は、プロジェクトやターゲットのタイプによって異なります。 特徴量を削減した特徴量セットを作成するための代替方法については、モデル推奨プロセスのドキュメントを参照してください。
リーダーボードとリポジトリの新しいフィルターオプション¶
このリリースから、リーダーボードやリポジトリで、選択したフィルターに一致するモデル/ブループリントだけを表示できるようになりました。 リーダーボードのフィルターでは、サンプルサイズ(または時系列プロジェクトの場合はトレーニング期間)、モデルファミリー、モデル特性、特徴量セットなどに分類されたオプションを設定できます。 リポジトリのフィルターには、ブループリントの特性、ファミリー、およびタイプが含まれます。 以前は、フィルターのためのより限定的な方法が別々の場所にありました。しかし、新しく強化されたフィルターオプションは、単一のモーダルに集約されています(1つはリーダーボード用、もう1つはリポジトリ用)。
詳細については、リーダーボードのリファレンスを参照してください。
時系列クラスタリング¶
クラスタリングは教師なし学習の手法の1つであり、データ内の自然なセグメントを識別するために使用できます。 DataRobotでは、クラスタリングによって、セグメントモデリングに使用するセグメントを検出できるようになりました。 この手法により、DataRobotプラットフォーム内から、複数系列のデータセット間で類似した系列を簡単にグループ化することができます。 探索されたクラスターを使用して、データの理解を深めたり、時系列のセグメントモデリングへの入力にしたりします。
このワークフローは、クラスタリングモデルを構築し、そのモデルを使用して、セグメントモデリングプロジェクトのセグメントを定義します。
新しいセグメンテーションで使用タブでは、セグメントモデリングプロジェクトでクラスターを使用できるようにします。
クラスタリングモデルはモデルレジストリにモデルパッケージとして保存されるので、以降のセグメントモデリングプロジェクトで使用することができます。
また、セグメントモデリングプロジェクトをすぐに作成せずに、明示的にクラスタリングモデルをモデルレジストリに保存することも可能です。 この場合、保存されたクラスタリングモデルパッケージを使用して、後でセグメントモデリングプロジェクトを作成できます。
クラスタリング機能の一般提供により、以下の点が改善されました。
-
クラスタリング専用の新しい系列のインサイトタブは、系列/クラスターの関係性や詳細に関する情報を提供します。
-
余計な特徴量セットを省いたプロジェクトの設定や、ウィンドウの設定がわかりやすくなりました。
-
クラスタリングモデル、およびその結果として得られるセグメントモデルは、予測に同じ量のデータを使用します(サイズは元のクラスタリングモデルのトレーニングサイズに基づきます)。
-
クラスターバッファはデータリーケージを防ぎ、セグメンテーションでホールドアウトパーティションになるものに対してクラスタリングモデルをトレーニングしないようにします。
-
セグメントモデリングに結果を使用しない場合は、トグルで10%のクラスタリングバッファを制御します。
詳細については、時系列クラスタリングのドキュメントを参照してください。
時系列で5GBに対応¶
このデプロイにより、DataRobotマネージドAIプラットフォーム上の時系列プロジェクトは、最大5GBまでのデータセットをサポートできるようになりました。 これまで、クラウド上の時系列プロジェクトでの上限は1GBでした。 プロジェクトやプラットフォームに基づいた詳細な情報については、データセットの要件リファレンスを参照してください。
時系列の精度の強化¶
複数系列モデリングでは最大100万系列、1000予測距離まで対応しているため、これまで、DataRobotは、オートパイロットの一部として精度計算を行う系列数を制限していました。 現在、これらの計算を使用する視覚化では、いくつかの系列(特定のしきい値まで)を自動的に実行してから、個別または一括で追加の系列を実行することができます。
この機能を活用できる視覚化は、次のとおりです。
- 時系列の精度
- 時間経過に伴う異常
- 予測値と実測値の比較
- モデル比較
詳細については、複数系列の時系列の精度のドキュメントを参照してください。
オートパイロットでのネイティブProphetおよび系列パフォーマンスブループリント¶
単一および複数系列の時系列プロジェクトでのネイティブProphet、ETS、TBATSモデルのサポートについては、6月のリリースで一般提供を発表しました。 (モデルの詳細な説明は、モデルのブループリントにアクセスすることで、モデルごとに確認できます。) このリリースでは、これらのモデルがクイックオートパイロットの一部として実行されないように若干の変更が加えられています。 DataRobotは、フルオートパイロットで適宜それらを実行しますが、モデルリポジトリから入手することもできます。
時系列プロジェクトとその設定の複製¶
一般提供機能になりました。時系列、OTV、セグメントモデリングなどの教師なしプロジェクトや時間認識プロジェクトを含め、あらゆるタイプのDataRobotプロジェクトを複製(「クローンを作成」)することが可能です。 以前は、この機能はAutoMLプロジェクト(時間を認識しない連続値と分類)でしか利用できませんでした。
プロジェクトの複製には、データセットのみを選択するオプション(データセットを再アップロードするよりも高速)と、データセットとプロジェクトの設定を選択するオプションがあります。 時間認識プロジェクトの複製では、ターゲット、特徴量派生と予測ウィンドウの値、選択されたカレンダー、事前に既知の特徴量、系列IDなど、すべての時系列設定のクローンが作成されます。 データ準備ツールを使って不規則なタイムステップの問題に対処した場合、クローン作成では修正されたデータセット(親プロジェクトでモデル構築に使用されたもの)が使用されます。複製オプションには、プロジェクトのドロップダウン(右上隅)またはプロジェクトの管理ページからアクセスできます。
時系列プロジェクトのスコアリングコード¶
一般提供機能になりました。Javaベースのスコアリングコードパッケージで時系列モデルをエクスポートすることができます。 スコアリングコードは、DataRobotアプリケーションの外でDataRobotモデルを利用するための、ポータブルかつ低レイテンシーな手法です。
モデルの時系列スコアリングコードは、以下の場所からダウンロードすることができます。
-
リーダーボードからダウンロード(リーダーボード > 予測 > ポータブル予測)
-
デプロイからダウンロード(デプロイ > 予測 > ポータブル予測)
セグメントモデリングでは、複数系列プロジェクトのセグメントに対して個別のモデルを構築することができます。 そして、DataRobotはこれらのモデルを統合し、統合モデルを作成します。 完成した統合モデルのスコアリングコードを生成することができます。
スコアリングコードを生成してダウンロードするには、統合モデルの各セグメントチャンピオンにスコアリングコードが必要です。
統合されたモデルの各セグメントチャンピオンにスコアリングコードがあることを確認したら、リーダーボードからスコアリングコードをダウンロードできますが、統合モデルをデプロイしてデプロイからスコアリングコードをダウンロードすることも可能です。
時系列モデルでは、ダウンロードするスコアリングコードJARに予測間隔を含めることができるようになりました。 予測間隔を含むスコアリングコードは、リーダーボードからまたはデプロイからダウンロードできます。
ダウンロードした時系列スコアリングコードを用いて、コマンドラインからデータのスコアリングを行うことができます。 このリリースから、時系列のスコアリングコードに効率的なバッチ処理が導入され、より大規模なデータセットのスコアリングが可能になりました。 詳細については、CLIでのスコアリングのための時系列パラメーターのドキュメントを参照してください。
時系列のスコアリングコードの詳細については、時系列プロジェクトのスコアリングコードを参照してください。
予測APIにおける時系列入力の自動展開¶
時系列モデルにおいて、予測ポイントを用いてAPI経由で予測を行う場合、予測データで予測ウィンドウをスキップできるようになりました。 DataRobotは、自動展開により予測ポイントを自動生成します。 自動展開は、予測範囲ではなく、特定の予測ポイントに対して予測が行われる場合に自動的に適用されます。 また、時系列プロジェクトに正規の時間ステップがあり、ナウキャストを使用していない場合にも適用されます。
バックテストごとに特徴量のインパクトを計算¶
特徴量のインパクトは、特にモデルのコンプライアンスドキュメントにおいて、モデルの概要をわかりやすく示します。 さまざまなバックテストとホールドアウトパーティションでトレーニングされた時間依存モデルでは、バックテストごとに異なる特徴量のインパクトの計算を行うことができます。 一般提供機能になりました。DataRobotのREST APIを使用して、バックテストごとに特徴量のインパクトを計算できます。これにより、特徴量のインパクトのスコアをバックテスト間で比較することによって、時間経過に伴うモデルの安定性を検査できます。
セグメントモデリングで新たに手動モードをサポート¶
このリリースから、セグメントモデリングで手動モードが使用できるようになりました。 これまでは、クイックまたはフルオートパイロットを選択することができました。 手動モードでセグメントモデリングを行う場合、DataRobotは、セグメントごとに個別のプロジェクトを作成し、モデリング段階まで準備を完了させます。 ただし、DataRobotはプロジェクト単位のモデルを作成しません。 統合されたモデルを(プレースホルダーとして)作成しますが、チャンピオンは選択しません。 手動モードを使用することで、モデル構築に時間をかけることなく、各セグメントでどのモデルをトレーニングし、チャンピオンとして選択するかを完全に手動でコントロールできます。
時系列セグメントモデリングのデプロイ¶
セグメントモデリングの価値を最大限に活用するために、他の時系列モデルをデプロイする場合と同様に、統合されたモデルをデプロイできます。 含まれているプロジェクトごとにチャンピオンモデルを選択した後、統合モデルをデプロイし、複数のセグメントに対して「1つのモデル」デプロイを作成できます。ただし、デプロイされた統合モデル内の各セグメントでは、引き続きセグメントチャンピオンモデルがデプロイで(バックグラウンドで)実行されています。 デプロイを作成すると、精度監視、予測間隔、チャレンジャーモデル、および再トレーニングにDataRobot MLOpsを使用できます。
備考
時系列セグメントモデリングのデプロイでは、データドリフトの監視には対応していません。 詳細については、機能に関する注意事項を参照してください。
セグメントモデリングのワークフローを完了し、オートパイロットが終了すると、モデルタブに1つのモデルが表示されます。 このモデルが完成した統合モデルです。 デプロイするには、統合されたモデル、予測 > デプロイ、モデルをデプロイの順にクリックします。
統合モデルをデプロイした後、デプロイされた統合モデルのクローンを作成し、クローンが作成されたモデルを修正することで、セグメントのチャンピオンを変更できます。 この処理は自動的に行われ、デプロイされた統合モデル内でセグメントのチャンピオンを変更しようとすると発生します。 クローンが作成され、修正可能なモデルが、アクティブな統合モデルになります。 このプロセスにより、デプロイされたモデルの安定性を確保しながら、同じセグメントプロジェクト内で変更をテストすることが可能になります。
備考
プロジェクトのリーダーボードでアクティブな統合モデル(バッジ付き)になれる統合モデルは1つだけです。
統合されたモデルがデプロイされると、予測APIは有効というラベルが設定されます。 このモデルを修正するには、アクティブでデプロイ済みの統合モデルをクリックし、セグメントタブで修正したいセグメントをクリックします。
次に、セグメントチャンピオンを再割り当てし、表示されるダイアログボックスではい、新しい統合モデルを作成しますをクリックします。
セグメントのリーダーボードで、アクティブな統合モデルにアクセスして修正できるようになりました。
詳細については、統合されたモデルのデプロイのドキュメントを参照してください。
セグメント化プロジェクトでの新しい指標のサポート¶
統合されたモデルは、時系列のセグメントモデリングプロジェクトにおいてすべてのセグメントの収集ポイントとして機能する主要な統括プロジェクトです。 このバージョンから、RMSEベースの指標がサポートされるようになりました。セグメントプロジェクトでは、これまでのMAD、MAE、MAPE、MASE、SMAPEのサポートに加えて、RMSE、RMSLE、Theil’s U(重み付けあり/なし)もサポートされます。
統合されたモデルの再トレーニングが高速化¶
一般提供機能になりました。時系列セグメントモデルでは、オートパイロットや特徴量削減を再実行することなく、元のモデルと同じ特徴量セットとブループリントで再トレーニングを行えるようになりました。 これまでは、オートパイロットを再実行することが、このモデルタイプを再トレーニングする唯一の方法でした。 この新しいサポートにより、セグメント化されていない時系列モデルとセグメント化されたモデルの再トレーニングが同等になりました。 この改善により、再トレーニングでは、元のトレーニングでの特徴量削減処理を活用できるようになりました。そのプロセスを経る必要があるのは、新しく導入された特徴量だけになったので、時間の節約と柔軟性の向上を実現できます。 再トレーニングはセグメントのチャンピオンを再トレーニングするものであり、プロジェクトを再実行して新しいチャンピオンを選ぶものではないことに注意してください。
プレビュー¶
クラスターモデルでの予測の説明¶
今回プレビュー機能として提供されるクラスタリングでの予測説明を使用すると、特定の行のクラスター割り当てに最も貢献した要因が明らかになります。 このインサイトによって、クラスタリングモデルの結果をステークホルダーにわかりやすく説明できます。また、影響の大きい要因が特定されるため、事業戦略に注力できます。
多クラス予測の説明とよく似た機能ですが、クラスではなくクラスターについてレポートします。この機能を有効にすると、クラスターの説明は、リーダーボードとデプロイの両方から入手できます。 この機能は、XEMPベースのすべてのクラスタリングプロジェクトで利用可能ですが、時系列では利用できません。
必要な機能フラグ:クラスタリング予測の説明を有効にする
プレビュー機能のドキュメントをご覧ください。
期間精度を使用して、トレーニングデータの特定の期間に焦点を当てる¶
OTVや時系列のプロジェクトでプレビュー機能として利用できる期間精度のインサイトでは、データセット内で期間を定義し、その期間の指標スコアをモデル全体の指標スコアと比較できます。 期間は、プロジェクトの日付/時刻特徴量に基づいてグループ化する行を特定する、別のCSVファイルで定義されます。
アップロードされ、インサイトが計算されると、DataRobotは期間ベースの結果の表と各期間の「時間経過に伴う」ヒストグラムを提供します。
必要な機能フラグ:期間精度のインサイト
プレビュー機能のドキュメントをご覧ください。
TTSモデルとLSTMモデルでのバッチ予測¶
時系列予測では、従来の時系列モデル(TTS)や長・短期記憶モデル(LSTM)(自己回帰(AR)や移動平均(MA)の手法を用いたシーケンスモデル)が一般的です。 ARモデルもMAモデルも、予測を行うためには、通常、過去の予測の完全な履歴を必要とします。 それに対して、他の時系列モデルでの予測に必要なのは、特徴量派生後の1行のみです。 これまで、バッチ予測では、履歴が各バッチの最大サイズを超える場合、有効な 特徴量派生ウィンドウ(FDW)を超えて履歴データを受け入れることができませんでしたが、シーケンスモデルではFDWを超える完全な履歴データが必要でした。 これらの要件により、シーケンスモデルはバッチ予測とは相容れないものとなりました。 このプレビュー機能を有効にすると、それらの制限が解除されるため、TTSおよびLSTMモデルでのバッチ予測が可能になります。
時系列のオートパイロットには、まだTTSモデルやLSTMモデルのブループリントが含まれていません。しかし、モデルリポジトリにあるモデルブループリントにアクセスすることができます。
TTSおよびLSTMモデルでバッチ予測を可能にするために、次のことが行われました。
-
バッチ予測を更新して、最大バッチサイズ (50MBまたは約100万行の履歴データと同等) までの履歴データを受け入れるようにしました。
-
TTSモデルを更新し、(完全な履歴が提供されない場合)不完全な履歴での再フィッティングを可能にしました。
予測時に十分な予測履歴を提供しない場合、予測の矛盾が発生する可能性があります。 TTSおよびLSTMモデルで精度を維持する方法については、予測精度に関する注意事項を参照してください。
この機能を有効にすると、デプロイされたTTSまたはLSTMモデルの予測 > 予測を作成タブと予測 > ジョブ定義タブにアクセスできます。
必要な機能フラグ:TTSとLSTMの時系列モデルのバッチ予測を有効にする
プレビュー機能のドキュメントをご覧ください。
時系列モデルパッケージの予測間隔¶
プレビュー版の機能です。モデルパッケージ生成時に、モデルの時系列予測間隔(1~100)の計算を有効にすることができます。 モデルパッケージ生成時に、モデルの時系列予測間隔(1~100)の計算を有効にすることができます。 DataRobotの時系列モデルをリモート予測環境で実行するには、モデルのデプロイまたはリーダーボードからモデルパッケージ(.mlpkgファイル)をダウンロードします。 どちらの場所でも、モデルパッケージの生成時に予測間隔の計算を選択できるようになりました。そして、DataRobotの外でポータブル予測サーバー(PPS)を使って予測ジョブを実行できます。
デプロイから予測間隔を含むモデルパッケージをダウンロードする前に、デプロイがモデルパッケージのダウンロードをサポートしていることを確認します。 デプロイには、DataRobotの構築環境と外部予測環境が必要です。これは、デプロイインベントリのガバナンスレンズを使用して確認することができます。
予測間隔を含むモデルパッケージをデプロイ(外部デプロイ)からダウンロードするには、予測 > ポータブル予測タブを使用します。
予測間隔を含むモデルパッケージをリーダーボードにあるモデルからダウンロードするには、予測 > デプロイまたは予測 > ポータブル予測タブを使用できます。
必要な機能フラグ:.mlpkgのすべての時系列間隔の計算を有効にする
詳しくはドキュメントをご覧ください。