Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

行の加重ブロック

行の加重を設定してモデルのパフォーマンスを向上させることができます。 行の加重パラメーターweight_exprは予測モデルのパラメーター内で使用でき、Eureqaモデルのチューニングの一環として変更できます。

備考

このEureqaのモデルレベルの行の加重は、DataRobotのプロジェクトレベルの行の加重(詳細オプションで設定)とは異なります。 DataRobotのプロジェクトレベルの行の加重を設定した場合、Eureqaモデルの検定スコアの計算方法(アウトオブサンプルデータでのパフォーマンス)に影響しますが、これらのモデルの最適化方法には影響しません。

行の加重を使用するとき

ここでは、行の加重を使用するとパフォーマンスが向上する可能性のある一般的なシナリオを示します。

  • 各データポイントにおいて、データの収集時またはその他のプログラムでの計算時に決定した信頼度値があるとします。 これらの信頼度値を含む特徴量(列)を作成し、行の加重変数として指定します。 DataRobotでデータが加重され、信頼度の高い値に多くの加重が加えられます。

  • いくつかの重要なデータポイントに追加の加重を加えるとします。 その場合、データをDataRobotにアップロードする前に新しい列をデータに追加します。 この新しい特徴量で重要な行に10、100、1000(またはその他の加重)などのラベルを設定し、残りの行を1に設定します。

  • 一般的なイベントに対してまれなイベントに多くの加重を加えてデータのバランスを取る場合を考えてみます。 具体的なケースでは、クレジットカード詐欺をモデル化する場合が考えられます。99.99%のデータポイントは正当な決済ですが、0.01%は詐欺です。 正当な決済を表す値が1の行の特徴量を作成し、詐欺を表す9999の値(99.99%/0.01%)の行の特徴量を作成することによって、均等なバランスで正当な決済と詐欺の両方をモデル化できます。

行の加重特徴量

モデル作成時に行の加重特徴量として参照するには、データセットをDataRobotにアップロードする前に行の加重特徴量を含めます。 その後、モデルをチューニングするときに、その特徴量の名前を行の加重特徴量として入力します。 これで、各行のデータの残りの部分に対して、その行の行の加重特徴量の値に比例して加重が適用されます。

行の加重式

いくつかの行の加重スキームは、行の加重特徴量ではなく行の加重式で簡単に作成できます。 定義されている場合、その行の値を使用して行の加重式が評価され、その結果で行に加重が適用されます。

1 / occurrences (variable_name)

この式を使用すると、データのバランスをすばやく取ることができます。 1つの特徴量の3つの値を含むデータセットを例に説明します。

x 1 / occurences (x)
99 0.5
99 0.5
86 1

occurrences(x)によって返される値は、xの特定の値がデータセットで発生する回数です。この例では最初の行の2が返され、2番目の行の2、そして3番目の行の1が返されます。 1/occurrences(x)を行の加重として選択すると最初の行に1/2の加重が加えられ、2番目の行に1/2の加重が加えられます。3番目の行には、1の加重が加えられます。

クレジットカードの例(上記を参照)では、正当な決済を表す行としてz(値は0)を作成し、詐欺を表す行に1の値を設定できます。 1/occurrences(x)の行の加重を選択すると、均等なバランスで正当な決済と詐欺がモデル化されます。 新しいデータが追加されると、加重が自動的に調整されてバランスが維持されます。

特殊な特徴量<row>は、行番号の値を取ります。 これを行の加重として使用すると、最初の行に1の加重、2番目の行に2の加重という形で加重が加えられます。

行の加重によってターゲットの動作(詐欺や障害など)がまれにしか発生しないまばらなデータセットの結果を向上させることができます。 この行の加重式を使用すると、データの稀有な信号を分離してハイライトすることができます。

その他の行の加重式

特殊な行の加重特徴量に加えて、カスタムの行の加重を作成する最良のオプションは、新しい特徴量を派生させ、カスタム式を使用して目的の行の加重で列に自動的に値を入力してから、その新しい派生した特徴量を行の加重特徴量として直接使用することです。 新しい特徴量の派生の詳細については、特徴量の変換に関するドキュメントを参照してください。

次の式の例では、データセットに特徴量xおよびyが含まれると仮定します。

  • abs( x )は、xの絶対値に比例して行の加重を計算します。
  • 1 / abs( x-y ) は、xとyの間の差分に逆比例して行の加重を計算します。
  • 1 / <row> 行1に1の加重、行2に1/2の加重、行3に1/3の加重という形で加重が加えられます。
  • 0.5 + 0.5 * ( <row> <= 100) では、行1~100に1の加重が加えられ、残りの行に0.5の加重が加えられます。(<= では条件が満たされた場合に1が返され、条件が満たされない場合は0が返されます。)

更新しました December 21, 2022