特徴量探索の設定¶
特徴量探索プロセスでは、DataRobotプロジェクトで 派生させる特徴量のリストをさまざまなヒューリスティックを用いて決定します。 特徴量探索の設定で、新しい特徴量の派生時にDataRobotが試行する変換を制御できます(特徴量エンジニアリングのコントロール)。また、冗長な特徴量やインパクトの小さい特徴量を自動削除(特徴量の削減)するように設定することもできます。
特徴量探索の設定にアクセスするには、関係性を定義するページで設定歯車をクリックします。
特徴量エンジニアリングの管理¶
特徴量エンジニアリングの管理を設定し、DataRobotで特徴量エンジニアリングを実行する方法に影響を与えることができます。 次の目的でこれを使用できます。
- ドメイン知識を使用して、特徴量エンジニアリングのプロセスを導き、派生した特徴量の品質を向上します。
- 特徴量エンジニアリングの速度を上げます。
- より多くの特徴量を派生することで、精度を向上させます。たとえば、カテゴリー統計、歪度、尖度を使用します。
- 複雑すぎてビジネス上の利害関係者に説明できない特定の変換を除外します。 モデリングの後、これらの特徴量を除外できますが、それではモデリングプロセスが複雑になってしまいます。
EDA2の前に、関係性エディターの特徴量エンジニアリングオプションを設定します。
特徴量探索の設定で、特徴量エンジニアリングタブをクリックします。 プロジェクトにとって最も有用な特徴量エンジニアリング変換を検討し、新しい特徴量の派生時にDataRobotで試行するものを選択します。
変換にカーソルを合わせて、それを説明するツールヒントを表示できます。
「最新」と「ウィンドウ内の最新の値」
| 変換 | 説明 | デフォルト | ---------- | ----------- | | 最新 | 定義されたFDWの終了ポイントまでのすべての履歴データを探索して、新しい特徴量を生成します。 この方法はすべてのFDW開始ポイントを無視することに注意してください。 | 無効 | | ウィンドウ内の最新の値 | 定義されたFDW内に新しい特徴量を生成します。 時間認識特徴量エンジニアリングでは、予測を行うときにFDW内のデータのみが必須です。 | 有効 |
終了したら、変更を保存をクリックします。
特徴量の削減¶
特徴量探索では、DataRobotが新しい特徴量を作成し、インパクトの低い特徴量や重複した特徴量を削除します。 これを特徴量の削減といいます。 また、以下のいずれかの方法で特徴量の削減を無効にするとその代わりに、モデル構築時にすべての特徴量を含めることができます。
関係性設定(関係性を定義 ページ)で、設定()の歯車をクリックします。 特徴量の削減タブを選択し、特徴量削減の管理を使用するをオフにします。