Skip to content

特徴量セットの操作

特徴量セットは、DataRobotでモデルの構築に使用する特徴量のサブセットを制御します。 自動作成されたセットの1つを使用するか、データページまたはメニューから手動で特徴量を追加することができます。 (一部の)特徴量セットのレビュー、名前変更、および削除を行うこともできます。 モデリングに使用されるセットは、デフォルトのモデリング特徴量セットと呼ばれます。 これは、[開始]ボタンをクリックしたときに選択される特徴量セットです。

選択内容を上書きしない場合、モデルの構築では以下のいずれかのセットが使用されます。

  • モデリングにおける潜在的に有用な情報を提供する全ての特徴量(有用な特徴量セット)。
  • ターゲットリーケージのリスクを伴う特徴量を削除した上で、モデリングを行う際に潜在的に有用な情報を提供する全ての特徴量(有用な特徴量からリーケージを除去したセット)。

EDA2の前または後に、特徴量を選択して新しい特徴量セットを作成できます。 ターゲット特徴量は、すべての特徴量セットに自動的に追加されます。 作成した新しい特徴量セットは、特徴量セットドロップダウンで使用できるようになります。 アクティブな特徴量セットが青くハイライトされます。このセットがページの特徴量の表示を制御します。

プロジェクトのデータタブは、デフォルトですべての特徴量に設定されています。これは実際の特徴量セットではなく、データセット内の個々の特徴量を表示する方法です。

特徴量セットの選択

DataRobotによって割り当てられたセット以外の特徴量セットを使用するには、デフォルトのモデリングセットとして使用するセットを特徴量セットドロップダウンから選択します。

別の特徴量セットを選択するには:

  1. プロジェクトのデータタブまでスクロールダウンします。

    デフォルトでは、すべての特徴量が一覧表示されます。

  2. 特徴量セットドロップダウンメニューをクリックし、新しい特徴量セット(この例では有用な特徴量)を選択します。

    有用な特徴量セットが、開始ボタンの下に表示されます。

特徴量セットの作成

自動作成された特徴量セットを使用しない場合は、カスタム特徴量セットを作成してモデルのトレーニングを行い、モデルが向上するかどうかを確認します。 これらのセットはデータページまたはメニューから作成できます。 さらに、特徴量のインパクトタブから特徴量のインパクトに基づいて特徴量セット(冗長な特徴量が除外された特徴量セットなど)を作成できます。 これらの特徴量セットの管理は後で特徴量セットタブから行うことができます。

カスタム特徴量セットの作成に関する詳細については、特徴量セットのリファレンスページを参照してください。

特徴量の型でフィルターして選択

特徴量のデータ型で特徴量をフィルターして選択します。

  1. プロジェクトのデータタブの左上にあるメニューをクリックし、特徴量の型で特徴量を選択をクリックします。

  2. 特徴量名の左側にあるチェックボックスを使用して、特徴量を追加または削除します。

  3. + 特徴量セットを作成をクリックし、新しい特徴量セット名を入力してカスタム特徴量セットを保存します。

特徴量セットタブ

データページの特徴量セットタブは、特徴量セットを管理するメカニズムを提供します。 このタブには、DataRobotで作成した特徴量セットやカスタム特徴量セットのサマリー(名前、特徴量の数、モデルの数、作成日、および説明)が表示されます。セット(の一部)の削除または名前変更を行ってセットを整理して、混乱を避けることができます。 名前の横に表示されるロック()は、そのセットを削除できないことを示します。

モデルを構築すると、特徴量セットには、自動作成されたセット(1)およびカスタムセット(2)が含まれます。

特徴量セットの管理

DataRobotには、特徴量セットを操作するためのツールがいくつか搭載されています。 セットの作成方法(自動または手動)、またはセットがリーダーボード上でモデルの作成に使用されたかどうかに応じて、アクションの動作が異なることがあります。

次の表にアクションを示します。

アイコン 説明
選択した特徴量セットの一部である特徴量をCSVファイルとしてエクスポートします。
選択した特徴量セットをプロジェクトデータタブで開きます。
セット名および説明を編集できるダイアログが表示されます。 (自動作成された特徴量セットの説明は変更できますが、名前は変更できません。)*
選択した特徴量セットを使用してオートパイロットを再実行します。*
or 選択したセットを削除します(またはセットが削除できないことを示します)。 自動作成された特徴量セットは削除できません。*

* 特徴量セットの削除または名前変更、およびオートパイロットの再実行を行うには、ユーザーレベル以上のプロジェクトアクセスが必要です。

ヒント

特徴量セットに対する特徴量の追加や削除を行うことはできません。 その代わりに、目的のすべての特徴量で新しい特徴量セットを作成してください。

特徴量セットの削除

特徴量セットを削除すると、プロジェクト内で、そのセットで構築されたモデルも削除されます。 削除できるのはカスタム特徴量だけです(名前の横にが表示されている特徴量は削除できません)。 モデリング中のカスタム特徴量を削除するオプションをクリックすると、影響を受けるモデルの数を示す注意が表示されます。

以下の特徴量セットでは、削除機能を使用できません。

  • 自動作成された特徴量セット。
  • プロジェクトのデフォルトのモデリングセット。
  • プロジェクトの単調制約特徴量セットとして設定された特徴量セット。
  • 時系列プロジェクトのモデリングデータセットを作成する入力特徴量セットとして使用される特徴量セット。
  • モデルデプロイで使用されている特徴量セット(モデルおよびその特徴量セットはデプロイを削除するまで削除できません)。

名前と説明の編集

カスタム特徴量セットを作成するとき、最初に表示されるダイアログで名前を付けます。 特徴量セットタブから、セットに説明を追加できます。 その説明を追加する場合、または既存の説明を編集する場合、セットをハイライトして鉛筆アイコン()をクリックします。

DataRobotで自動作成されたセットの説明は変更できますが、名前は変更できません。

特徴量セットでオートパイロットを再実行

モデルを構築した後、特徴量セットタブからオートパイロットを再実行します。 これは、オートパイロットを実行した後に特徴量セットをカスタマイズし、追加のモデルを生成する場合に便利です。

備考

プロジェクトのモデルの構築中にオートパイロットを再実行すると、現在実行している特徴量セットが中断(その特徴量セットでの新規モデルの構築が停止)され、選択したセットを使用してオートパイロットが最初から再実行されます。

これは、右側のパネルのワーカーキューで使用できるモデリング設定の構成リンクからオートパイロットを再実行するのと同じアクションであることに注意してください。

カスタム特徴量セットでオートパイロットを再実行するには:

  1. カスタム特徴量セットを作成します

  2. データタブで、特徴量セットタブをクリックします。

  3. 新しいモデルの構築に使用する特徴量セットの右側にあるメニューをクリックし、 オートパイロットを再実行を選択します。

  4. モデリングを再実行ウィンドウで、モデリングモードを選択し、再実行をクリックします。