Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

特徴量の削減により削除された特徴量の復元

時系列プロジェクトでは、DataRobotはプロジェクト開始時のウィンドウ設定に基づいて派生特徴量を生成します。次に、DataRobotは特徴量削減アルゴリズムを実行し、影響が少ないと検出した特徴量を削除します。ただし、アルゴリズムによって、特徴量削減プロセス中にいくつかの重要な特徴量が削除される場合があります。生成された特徴量リストに含めたい特徴量、または特徴量の影響を評価した特徴量です。この例としては、特定のカレンダーから派生した特徴量や、財務変数の特定の数値統計があります。EDA2が完了したら、これらの特徴量を利用可能な派生モデリングデータに戻すことができます。

備考

高度なオプションで監視対象の削減を無効にしても、DataRobotはエクストラクターの優先度に基づいて特徴量を削除する場合があります。これらの特徴量は、復元プロセスで復元することもできます。

削除された特徴量を特定する

特徴量削減プロセスで特徴量が削除されたかどうかを判断する最も簡単な方法は、EDA2の完了後に特徴量派生ログを確認することです。

データセットのサイズによっては、ログをダウンロードする必要がある場合があります。 これは、縮小プロセスが最後に実行され(ファイルの最後にある)、プレビューから切り捨てられる可能性があるためです。

削除された特徴量を復元

次に、削除された特徴量(派生ログから識別された)をモデリングデータセットに復元する方法について説明します。すべての特徴量を復元するか、サポートされている最大特徴量に達するまで、このオプションを繰り返し使用できます。これは、データの取り込み制限によって制約される場合があります。

  1. データ> 派生モデリングデータタブで、メニューから剪定されたフィーチャを復元を選択します。

  2. 剪定された特徴量の復元ウィンドウで、入力を開始して復元する特徴量を選択します。DataRobotは、追加し直すことができる特徴量の数を示します。

  3. 必要な特徴量がすべてリストされたら、特徴量の追加をクリックします。DataRobotは進捗状況を報告します:

    そして成功:

  4. 復元を確認するには、インデックス列をクリックします。DataRobotは特徴量を再ソートし、復元された特徴量を最初に一覧表示し、復元アイコン()でマークします。

備考

特徴量の復元では、EDA2中に作成された特徴量リストは変更されません。復元された特徴量をモデリングに使用するには、新しい特徴量リストを作成します。

新しい特徴量セットを作成

特徴量が復元されると、それらは既存の特徴量リストに追加されません。新しい特徴量をモデリングデータセットの一部として使用するには、それらを組み込んだ新しい特徴量リストを作成する必要があります。例:

  1. 派生モデリングデータタブから、最もパフォーマンスの高い特徴量セットを選択します。そのリスト内のすべての特徴量を選択するには、特徴量名ボックスをオンにします。

  2. すべての時系列特徴量リストに変更します(前のアクションからの選択は保持されます)。

  3. 追加する復元された特徴量を選択します。

  4. 特徴量セットの作成をクリックして、新しいリストを追加します。

復元された特徴量を含む1つ以上の新しいリストが作成されたら、それらを使用してモデルを構築します(個別に、またはオートパイロットを再実行します)。リスト間でモデルのパフォーマンスを比較して、予測に使用するモデルの一部として復元された特徴量を含めることに価値があるかどうかを確認します。


更新しました February 22, 2022
Back to top