特徴量を変換する¶
このセクションでは、ユーザー作成の手動による特徴量変換について説明します。 変換された特徴量によって元の特徴量が置換されることはありません。変換された特徴量は、モデル構築用の新しい追加特徴量として提供されます。
備考
Transformed features (including numeric features created as user-defined functions) cannot be used for special variables, such as Weight, Offset, Exposure, and Count of Events.
特徴量の型変換¶
DataRobot bases variable type assignment on the values seen during EDA—these values are displayed in various areas throughout NextGen. しかし、特徴量の型を変更する必要がある場合もあるでしょう。 たとえば、市外局番は数値として解釈されますが、カテゴリーとしてマップすることが好ましい場合があります。 または、カテゴリー特徴量が数値としてエンコードされることがあります(1=yes, 2=no などのように特徴量値にマップする場合)。この場合、変換なしでは数値として解釈されます。
Variable type transformations are only available when it is appropriate to the feature type, so there are certain cases where you cannot perform a transformation. これらのケースには、整数値と浮動小数点値の両方に関してDataRobotで特殊列として識別された列が含まれます。 (Date columns are a special case and do support transforms.) Additionally, a column that is all numeric except for a single unique non-numeric value is treated as special. この場合、DataRobotでは、一意の値がNaNに変換され、その値が失われることを防止するために変換が無効化されます。
備考
数値特徴量の型からカテゴリー特徴量に変換する場合、小数点以下の値は切り捨てられることに注意してください。 値は整数に丸められます。 また、欠損値を含む浮動小数点値をカテゴリー特徴量に変換する場合、新しい特徴量に変換されますが、丸め処理は行われません。 たとえば、9.9は10ではなく、9になります。
ヒント
DataRobotで予測を行う場合、予測データに含まれる列は元のデータと同じであることが予期されます。 モデルで元の変数と変換された変数を使用する場合、予測データでは、元の特徴量の名前を使用する必要があります。 DataRobotの内部で派生した特徴量が生成されます。
Availability in NextGen¶
You can perform transformations on dataset features from the following areas in NextGen:
- Within a Use Case, the Features tile on the data explore page.
- Within a Use Case, the Features tile of an experiment.
- The Feature lists tab in Data Registry.
Transform a feature¶
The feature transformation workflow below is the same across NextGen. To transform a feature:
-
From the Features tile of either an experiment or the data explore page, do one of the following:
-
The options displayed in the resulting window are based on the original variable type of the feature:
要素 説明 1 変換タイプ 変換後の特徴量の新しい型を表示します。 2 新しい特徴量の名前 新しい特徴量の名前を入力するフィールドが提供されます。 デフォルトでは、新しい特徴量の型が追加された既存の特徴量名が使用されます。 3 変換を実行 新しい特徴量を作成します。 新しい特徴量は、元の特徴量の下に表示されます。 要素 説明 1 変換タイプ 変換後の特徴量の新しい型を表示します。 2 新しい特徴量の名前 新しい特徴量の名前を入力するフィールドが提供されます。 デフォルトでは、新しい特徴量の型が追加された既存の特徴量名が使用されます。 3 変換を実行 新しい特徴量を作成します。 新しい特徴量は、元の特徴量の下に表示されます。 要素 説明 1 変換オプション ドロップダウンを使用して、現在の特徴量に使用可能な特徴量型から新しい型を指定します。 DataRobotで数値およびカテゴリー特徴量の型の特定の変換が実行されます。 2 新しい特徴量の名前 新しい特徴量の名前を入力するフィールドが提供されます。 デフォルトでは、新しい特徴量の型が追加された既存の特徴量名が使用されます。 3 変換を実行 新しい特徴量を作成します。 新しい特徴量は、元の特徴量の下に表示されます。 -
特徴量を作成をクリックします。 The transformed feature appears under the original feature. 変換された特徴量は、新しい特徴量セットに含めることやモデリングに使用することができます。 予測用に変換された特徴量を含むモデルを使用する場合、DataRobotはアップロードされたデータセットに新しい特徴量を自動的に含めます。
同じ特徴量から任意の数の変換を作成できます。 デフォルトでは、各変換に一意の名前が適用されます。 間違って作成された重複した特徴量は、重複としてマークされ、処理において無視されます。





