Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

特徴量の削減により削除された特徴量の復元

時系列プロジェクトでは、DataRobotはプロジェクト開始時のウィンドウ設定に基づいて派生特徴量を生成します。 次に、DataRobotは特徴量削減アルゴリズムを実行し、影響が少ないと検出した特徴量を削除します。 ただし、アルゴリズムによって、特徴量削減プロセス中にいくつかの重要な特徴量(生成された特徴量セットに含めたい特徴量、または特徴量のインパクトを評価した特徴量)が削除される場合があります。 この例としては、特定のカレンダーから派生した特徴量や、財務変数の特定の数値統計があります。 EDA2が完了したら、これらの特徴量を利用可能な派生モデリングデータに戻すことができます。

備考

高度なオプションで監視対象の削減を無効にしても、DataRobotはエクストラクターの優先度に基づいて特徴量を削除する場合があります。 これらの特徴量は、復元プロセスで復元することもできます。

削除された特徴量を特定する

特徴量削減プロセスで特徴量が削除されたかどうかを判断する最も簡単な方法は、EDA2の完了後に特徴量派生ログを確認することです。

データセットのサイズによっては、ログをダウンロードする必要がある場合があります。 これは、削減プロセスが最後に実行され(ファイルの最後にある)、プレビューから切り捨てられる可能性があるためです。

削除された特徴量を復元

次に、削除された特徴量(派生ログから識別された)をモデリングデータセットに復元する方法について説明します。 すべての特徴量を復元するか、サポートされている最大特徴量に達するまで、このオプションを繰り返し使用できます。これは、データの取り込み制限によって制約される場合があります。

  1. データ> 派生モデリングデータタブで、メニューから削除された特徴量を復元を選択します。

  2. 削除された特徴量を復元ウィンドウで、入力を開始して復元する特徴量を選択します。 DataRobotは、追加し直すことができる特徴量の数を示します。

  3. 必要な特徴量がすべてリストされたら、特徴量を追加をクリックします。 DataRobotは進捗状況を報告します:

    そして成功:

  4. 復元を確認するには、インデックス列をクリックします。 DataRobotは特徴量を再ソートし、復元された特徴量を最初に一覧表示し、復元アイコン()でマークします。

備考

特徴量の復元では、EDA2中に作成された特徴量リストは変更されません。復元された特徴量をモデリングに使用するには、新しい特徴量セットを作成します。

新しい特徴量セットを作成

特徴量が復元されると、それらは既存の特徴量セットに追加されません。 新しい特徴量をモデリングデータセットの一部として使用するには、それらを組み込んだ新しい特徴量リストを作成する必要があります。 例:

  1. 派生モデリングデータタブから、最もパフォーマンスの高い特徴量セットを選択します。 そのリスト内のすべての特徴量を選択するには、特徴量名ボックスをオンにします。

  2. すべての時系列特徴量リストに変更します(前のアクションからの選択は保持されます)。

  3. 追加する復元された特徴量を選択します。

  4. 特徴量セットを作成をクリックして、新しいリストを追加します。

復元された特徴量を含む1つ以上の新しいリストが作成されたら、それらを使用してモデルを構築します(個別に、またはオートパイロットを再実行します)。 リスト間でモデルのパフォーマンスを比較して、予測に使用するモデルの一部として復元された特徴量を含めることに価値があるかどうかを確認します。

ディープダイブ:低インパクトの定義

DataRobotは特徴量削減アルゴリズムを実行し、影響が少ないと検出した特徴量を削除します。 つまり、内部アルゴリズムは、(クイックモードで)インパクトのスコアが最低80%になるように、特徴量の境界を設定します。 モデリングデータセット作成時の追加計算は、以下のとおりです。

  • 派生後の特徴量の総数(元の特徴量と派生特徴量)は、元の特徴量数の10倍または500特徴量のいずれか多い方が上限です。

  • 元の特徴量の数が50未満の場合、DataRobotは元の特徴量ごとに少なくとも1つの派生特徴量があることを保証します。 元の特徴量の数が50を超える場合、この制限は適用されず、DataRobotは重要でないと判断した特徴量をすべて破棄します。

続けて読む

このページで説明されているトピックの詳細については、以下を参照してください。


更新しました January 23, 2024
Back to top