Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

時系列 (V7.3)

2021年12月13日

DataRobot v7.3.0リリースには、以下の多くの新しい時系列機能が含まれています。リリース7.3.0の詳細については、AutoMLMLOpsのリリースノートもご参照ください。

新しい時系列機能

以下の一般提供された新機能の詳細をご覧ください:

以下のパブリックプレビュー新機能の詳細をご参照ください:

一般提供されている機能

以下の新機能が一般提供されました。

複数系列プロジェクト向けセグメントモデリング

極端なデータの多様性を処理したり、人間の複雑な購買パターンを詳細なレベルで予測できる単一のモデルはありません。通常、複雑な需要予測を行うためには、統計に関する深いノウハウと長期にわたる開発プロジェクトやビッグデータ・アーキテクチャに費やす無制限の予算が必要となります。セグメントモデリングを使用した複数系列がリリースされる前は、データセットを1GB以下のサイズに分割し、データの各セグメントをモデリングするモデルファクトリーを設定し、セグメントごとにモデルをデプロイする必要がありました。一般提供になった機能として、DataRobotではセグメントモデリングを提供し、最大100個のセグメントを持つプロジェクトを構築でき、トレーニングデータセットのサイズは最大1GBまで設定できるようになりました。(5GBまでのセグメントをサポートする機能はパブリックプレビュー機能として提供されています。詳細については、DataRobotの担当者にお問い合わせください。)

セグメントは系列のグループで、各セグメントはオートパイロットを実行し、独自のリーダーボードを持っています。次に、DataRobotは、各セグメントのリーダーボードからチャンピオンモデルを選択、準備し、そのチャンピオンをプロジェクトの統合モデルにフィードします。DataRobotによるチャンピオンモデルの選択を上書きすることができます。統合モデルは新しいモデル情報で更新され、デプロイはこの変更を反映して更新されます。セグメントモデリングでは、すべてのセグメントが統合モデルで表現されますが、それは単一のデプロイのみを表現しています。

詳細は、セグメンテーションを用いた複数系列モデリングを参照してください。

時系列データ準備ツールを一般提供し、品質チェック機能を追加

時系列データ準備ツールが一般提供されるようになりました。このリリースでは、補完された特徴量が補完されたターゲットをリークしていないことを確認する(「事前に既知」(KA) の特徴量の潜在的な問題のみ)、データ品質チェック用のツールが追加されました。補完リーケージのリスクが高い、または中程度であると識別された特徴量は、KA特徴量のセットから削除されます。

さらに、準備したデータセットを使用したモデルからデプロイが作成された場合、モデルパッケージには、AIカタログで作成された予測データセットに変換を適用するために必要な情報が含まれています。

詳細については、時系列データ準備ツールのドキュメントを参照してください。

時系列プロジェクトのカレンダーでの詳細な時間指定(一般提供機能)

このリリースでは、自分のカレンダーファイルをアップロードする際に、カレンダーのイベント関連特徴量を、よりきめ細かいタイムスタンプベースのレベルで引き出すことができるようになりました。さらに、イベントの特異度をより強調するために、期間を指定することができます。精度を確保するために、DataRobotは重複するカレンダーイベントに基づいてカレンダーから派生する特徴量をサポートするガードレールを提供します。カレンダーに1日単位のイベントしかない場合は、この機能をスコアリングコード(パブリックプレビュー)で使用するためのカレンダーファイルの要件を参照してください。

詳細については、カレンダーファイル情報を参照してください。

特徴量の削減により削除された特徴量の復元

インパクトの少ない特徴量であっても、派生した特徴量をモデリングデータに復元する機能の一般提供が開始されました。これで、それらを含む新しい特徴量セットを作成することができます。パブリックプレビューバージョンからの改善点として、インデックス列をクリックして復元された主要な特徴量(アイコンが表示されている)で再ソートすることができます。

詳細については、特徴量の復元のドキュメントを参照してください。

複数系列プロジェクトでのテキスト列のサポート

数値型とカテゴリー型に加えて、テキスト列を複数系列IDとして選択できるようになりました。以前は、当初すべての特徴量の型を受け入れていましたが、ビルド時に問題が発生することがありました。今回、テストの向上により有効な型のみが選択可能となりました。

多クラス混同行列でのバックテストのサポート

このリリースでは、多クラス混同行列のデータ選択ドロップダウンで、個々のバックテスト、すべてのバックテスト、ホールドアウトパーティション(ロックが解除されている場合)のいずれかに基づいて表示できるようになりました。

詳細については、混同行列のドキュメントを参照してください。

時系列の精度のパフォーマンス向上

このリリースでは、時系列の精度タブのパフォーマンスが向上しました。このチャートでは、バックテスト、時間単位、予測距離を選択して予測値と実測値をプロットすることで、予測が時間とともにどのように変化するかを視覚的に確認することができます。チャートの複雑さのため、計算負荷が高くなりデータセットのサイズによっては、多大な社内リソースが必要になることもあります。今回、計算の最適化により、パフォーマンスの高速化とリソースへの負荷の軽減が図られています。

詳細については、時系列の精度のドキュメントを参照してください。

パブリックプレビュー機能

以下の機能はパブリックプレビュープログラムの一部です。

時系列のスコアリングコード

このリリースでは、時系列のスコアリングコードのパブリックプレビュー機能が拡張されました。リリース7.2でサポートされていたブループリントと機能に加えて、今回のリリースでは予測距離(FD)スプリットと加重ローリングウィンドウがサポートされました。

備考

カレンダーを使用しているプロジェクトでスコアリングコードのサポートが必要で、かつカレンダーに1日単位のイベント(休日など)しかない場合、プラットフォーム管理者にそのアカウントで時系列プロジェクトのカレンダーで詳細な時間指定を無効にする機能フラグを設定するように依頼してください。

AIアプリビルダーにおける時系列予測のサポート

パブリックプレビューで提供できるようになった機能として、複数系列と単一系列の両方のプロジェクトで、AIを利用した予測アプリケーションを構築できるようになりました。時系列デプロイで、アクションメニューをクリックして[新規アプリケーションの作成]を選択します。作成後、バッチ予測をアップロードすると、新しい時系列ウィジェットが表示されます。このウィジェットでは、時間単位の変更、カレンダーイベント(アップロードされている場合)の表示、新しいデータの予測値と実測値の比較、時系列での予測説明のインサイトの表示などを実行できます。

詳細については、時系列予測アプリケーションを参照してください。

時系列の問題の修正

ユーザーから報告された以下の問題が、リリース7.2.0以降修正されました。

  • TIME-9790:ダウンサンプリングされていない時系列プロジェクトの予測距離分割モデルで、ダウンサンプリング済みのトレーニング予測を修正しました。

  • TIME-9425:スマートサンプリングされ、バックテスト設定がカスタマイズされたOTVプロジェクトにアクセスすると、空白ページが表示されることがありましたが、この問題を修正しました。

  • TIME-9796:系列変更時に予測と実測のチャートがクラッシュする問題を修正しました。


更新しました July 21, 2023