Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

複数系列のセグメント化されたモデリング

通常、複雑で精度の高い需要予測を行うためには、統計に関する深いノウハウと長期にわたるビッグデータ・アーキテクチャに関する開発プロジェクトが必要となります。セグメント化されたモデリングがあるDataRobotの複数系列は、複数のプロジェクトを「内部で」作成することでこの要件を自動化します。セグメントが識別および構築されると、それらはマージされて単一オブジェクト(結合モデル)を作成します。これにより、モデルのパフォーマンスが向上し、デプロイまでの時間が短縮されます。

セグメント化されたモデリングを使用すると、DataRobotは、各セグメントに完全なプロジェクトを作成します。フルパイロットまたはクイックパイロットを実行してから、デプロイに推奨されるモデルを選択(および準備)します。DataRobotは、推奨されたモデルを「セグメントチャンピオン」としてマークしますが、いつでもチャンピオンを再割り当てできます。

備考

DataRobotは、各セグメントにプロジェクトを作成しますが、これらのプロジェクトはプロジェクト管理センターから使用 できません。代わりに、それらはプロジェクト管理センター 使用可能な結合モデル内から調査および管理されます。

DataRobotは、各セグメントチャンピオンを組み込んで 結合モデル(すべてのセグメントの収集ポイントとして機能するメインアンブレラプロジェクト)を作成します。結果として、「ワンモデル」デプロイ(セグメントプロジェクト)が得られます。各セグメントには、バックグラウンドのデプロイで実行される独自のモデルがあります。

セグメント化されたモデリングはいくつかの問題(モデルファクトリー、複数のデプロイ)を解決しますが、最も注意するセグメントまたは最もROIが高いものを認識できません。成功するためには、ユースケースを正しく定義して、データセットを設定し、セグメントを定義する必要があります。

詳細については、セグメント化されたモデリングFAQを参照してください。セグメント化されたモデリングを使用する理由の迅速な表現については、視覚的な概要を参照してください。

セグメント化されたモデリングのワークフロー

複数系列連続値プロジェクトではセグメンテーション付きのモデリングが使用できます。以下に、セグメント化されたモデリングワークフローを説明します。

  1. 標準時系列ワークフローに従って、ターゲットを設定し、時間認識モデリングをオンにします。モデリング方法としてバックテストで自動時系列予測を選択します。

  2. 系列識別子を設定することにより、複数系列モデリングを有効にします。

  3. 鉛筆をクリックして、セグメンテーション方法を変更します。

  4. 表に示す通り、セグメンテーション設定を設定します。

    選択項目 説明
    はい、セグメントごとにモデルを構築する このオプションを選択して、セグメント化されたモデリングを有効にします。選択すると、セグメントがどのように定義されるか(3)も設定する必要があります。
    いいえ、セグメント化せずにモデルを構築する このオプションを選択して、前の時系列予測ウィンドウに戻ります。セグメント化されたモデリングを行なわない場合、DataRobotは、検出されたすべてのモデル(通常の複数系列)向けの1つのモデルに構築します。
    セグメントの定義方法 DataRobotがセグメントIDとして使用するトレーニングデータセットから列を選択します。列名の入力を開始して、一致する自動補完選択を表示するか、DataRobotが識別した識別子から選択します。セグ麺とIDは系列IDとは異なる必要があります。
  5. IDが設定されたら、セグメンテーション方法を設定をクリックします。時系列予測ウィンドウは、選択された系列とセグメントの変更など、設定(トレーニングウィンドウ、期間、KA、カレンダー選択)を続けることができます。

  6. 設定が準備ができれば、クイックオートパイロットまたはフルオートパイロットを選択して、開始をクリックします。DataRobotは、各セグメントに完全なオートパイロットプロジェクトを構築するため、モデリングの完了に必要な時間が非常に長くなる場合があることを通知します。モデリングを開始をクリックして、続けることを確認します。(今後のセグメントプロジェクトでは承認なしで続けられるように、DataRobotを設定できます。)

  7. EDA2が完了すると、DataRobotは結合されたモデルがすぐに作成されます。「子」モデル(独立したセグメントモデル)が構築中であるため、結合モデルは完成しません。ただし、結合モデルから構築とワーカーの割り当てを制御できます。

  8. モデリングが完了すると、結合モデルを使用してセグメントを探すことができます。

結果を調べる

オートパイロットが終了すると、モデルタブは、1つのモデルが構築されていることを示します。これは、完成した結合モデルです。

セグメント化されたモデリングで使用できるチャートとグラフは、モデルタイプに依存します。

  • 結合モデルの場合、セグメンテーション、モデルのブループリント、モデリングログ、予測の作成、およびコメントにアクセスできます。

  • 個別のセグメントで使用可能なモデルについては、複数系列連続値プロジェクトに適合するビジュアライゼーションおよびモデリングタブ(リポジトリ、モデルを比較など)が使用できます。

セグメンテーションタブ

クリックして結合モデルを展開し、セグメンテーションタブを表示します。

以下の表は、セグメンテーションタブのコンポーネントを示します。

コンポーネント 説明
検索 検索を使用して、入力した文字列に一致するセグメントだけが含まれるように表示を変更します。
CSVのダウンロード 指標スコア、チャンピオン履歴、ID、プロジェクト履歴など、統合モデルに関連付けられたメタデータを含むスプレッドシートをダウンロードします。
セグメント DataRobotによるトレーニングデータで見つかったセグメント値を指定されたセグメントIDにリストします。
トレーニングデータからのセグメント統計(生の行の数とそれらの行が表すデータセットの割合)を表示します。
総モデル数 オートパイロットプロセス中にそのセグメントに対してDataRobotが構築したモデルの数を示します。
チャンピオンの最終更新 最後にセグメントチャンピオンを割り当てた際の時間と担当者を示します。ここでは、チャンピオンモデルタイプを示すアイコンも表示されます。最初に、すべての行がDataRobotによってリスト表示されます。セグメントは、「すべてのバックテスト」スコア別にリスト表示されます。並び替える場合は、列ヘッダーをクリックします。
バックテスト1 選択した指標のチャンピオンモデルのバックテスト1スコアを示します。
すべてのバックテスト チャンピオンモデルに対して実行されるすべてのバックテストの平均スコアを示します。
ホールドアウト ホールドアウトがロック解除されているかどうかを示すアイコンを提供します。

セグメントの探索

結合モデルは、セグメントあたり1つのモデル(セグメントチャンピオン)で構成されます。一方、個別のセグメントは、完全なオートパイロットプロジェクトで構成されます。セグメントのリーダーボードからプロジェクトを調査したり、結合モデルから独立してセグメントモデルをデプロイすることもできます。

セグメントリーダーボードへのアクセス

リーダーボードにアクセスする方法は複数あります。

結合モデルから

結合モデルを展開して、セグメンテーションタブリストでセグメント名をクリックします。

クリックすると、セグメントのリーダーボードが開きます。以下の点に注意してください。

インジケーター 説明
モデルの完全なセットが構築されます。
DataRobotは、デプロイにモデルを推奨し、チャンピオンとしてマークします。
通常のワーカーキューコントロールを使用できます。

セグメントドロップダウンから

セグメントドロップダウンを使用して、ビューを変更します。

  • セグメントから:
    • 別のセグメントを選択します。セグメントのリーダーボードが表示されます。
    • すべてのセグメントを表示を選択して、結合モデルに戻ります。
  • 結合モデルから、セグメントを選択してセグメントのリーダーボードを開きます。

チャンピオンモデルの再割り当て

DataRobotは最初にセグメントチャンピオンを割り当てますが、指定を変更することもできます。これは、例えば、すべてのセグメントが結合モデルに同じモデルタイプを提供することが重要な場合などに当てはまります。セグメントのリーダーボードからセグメントチャンピオンを識別します。セグメントのリーダーボードでは、セグメントチャンピオンがチャンピオンバッジでマークされています。

セグメントリーダーボードからチャンピオンを再割り当てするには、チャンピオンとして任意のモデルを選択します。次に、メニューからリーダーボードオプション > チャンピオンとしてモデルをマークするを選択します。

バッジは新しいモデルに移動します。

また、結合モデルのセグメンテーションタブには、チャンピオンが最終更新された日時と新しいチャンピオンを割り当てた担当者が表示されます。

プロジェクト全体の管理

DataRobotは、各セグメントを個別オートパイロットプロジェクトとして扱うため、結合モデルの作成にかかる時間は通常の複数系列プロジェクトよりも長くなる場合があります。かかる正確な時間は、セグメントの数とデータセットとサイズによって異なります。以下のコントロールを使用して、ワーカーを設定し(1)、モデリングを停止および開始(2)することができます。すべてのアクションは、結合モデルのワーカーキューから実行され、すべてのセグメントプロジェクトに適用されます。それを使用して、ホールドアウトのロック解除(3)も使用できます。

ワーカーの制御

結合モデルから、すべてのセグメントプロジェクトのモデリングワーカーの数を制御できます。各セグメントがモデリングを完了するため、DataRobotは、セグメント間のワーカーを自動的にバランス調整し、実行中のセグメント間で使用可能なワーカーを分散します。ワーカー数を変更すると、DataRobotはモデリングステージでないプロジェクトを無効にします。

子モデリングの一時停止/開始/停止

親セグメントプロジェクトのワーカーキューから、子プロジェクトのモデリングアクションを制御できます。サイドバーで停止/開始/キャンセルボタンを使用し、選択したアクションはすべての子プロジェクトに適用されます。注意点は次のとおりです。

  • セグメントプロジェクトの開始時に、キューアクションは使用できません。

  • すべてのセグメントがEDA2ステージに達すると、休止および開始ボタンが使用可能になります。

  • 子プロジェクトがモデリングステージで使用可能になり、少なくとも1つのジョブが実行中である場合、キャンセルボタンが使用可能になります。

ホールドアウトのロックを解除

プロジェクト全体または各セグメントのホールドアウトをロック解除できます。

  • プロジェクト全体(すべてのセグメント内のすべてのモデル)をロック解除するには、結合モデルのワーカーキューからホールドアウトのロック解除を選択します。

  • セグメント内のすべてのモデルのホールドアウトをロック解除するには、(セグメントのリーダーボードを開き)ワーカーキュー内のすべてのモデルのプロジェクトホールドアウトをロック解除を選択します。

リーダーボードモデルのスコア

リーダーボードで結合モデルを見ると、スコアが表示されていないことに気付かれたかと思います。

これは、連続値プロジェクトのデフォルト指標がRMSEであるためです。指標をMAEなどのサポートされている指標に変更した場合、チャンピオンモデルの集計されたスコアが使用可能になります。(サポートされている指標はMAD、MAE、MASE、MAPE、SMAPEです。)

チャンピオンスコアに基づく結合モデルのスコアまたは(チャンピオンがデプロイモデル向けに作成されている場合)その親のスコア。個別のチャンピオンスコアを確認するには、結合モデルを展開して、セグメンテーションタブを表示します。

チャンピオンスコアがない理由

DataRobotがチャンピオンモデルを選択すると、そのモデルがデプロイ向けに準備されます。準備の一環として、モデルはホールドアウトに再トレーニングされます(最新のデータに開始/終了モデルとして再トレーニングされます)。チャンピオン/推奨モデルの親はチャンピオンのトレーニング のモデルです。そのため、親を見るとチャンピオンのスコアが分かります。

スコアはこの場所にレポートされます。チャンピオンを変更すると、DataRobotはスコアを新しいチャンピオン(またはその親)から結合モデルに渡します。以下の点に注意してください。

  • スコアの横のアスタリスクは、スコアが親モデルのスコアを反映していることを示します。

  • スコア列のN/Aは、バックテストが実行されていないことを示します。セグメントのリーダーボードでモデルを開き、「すべてのバックテスト」を実行します。


更新しました February 22, 2022
Back to top