Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

モデルの追加/削除

このセクションでは、最初のモデル構築後のモデルの操作方法について説明します。

リーダーボードからのモデルの追加

リーダーボードが作成されてからモデルを追加作成するには、メニューオプションの[新しいモデルを追加]を使用するか、既存のモデルを異なるサンプルサイズで再トレーニングするかの、2つの方法があります。いずれの方法でも、変更を送信すると、リクエストの進捗状況がワーカーキューに表示されます。

新しいモデルの追加の使用

リーダーボードから新しいモデルを作成できます。この方法では、リポジトリの[実行]ボタンを使用する場合と同じ機能が利用できます。リーダーボードから新しいモデルを作成するには、次の操作を実行します。

  1. リーダーボードの一番上にある新しいモデルを追加をクリックします。

  2. 少なくとも1つの新しいモデルの特性(モデルタイプ、特徴量セット、サンプルサイズ、交差検定の合格数)を選択します。[モデルを追加] をクリックします。

新しいモデルがリーダーボードのリストに表示されます。

モデルの再トレーニング

異なる数の行、または異なるパーセンテージのデータを使用してリーダーボードモデルを再トレーニングするには、レポートされているサンプルサイズの横にあるプラス記号をクリックします。

新しい値を設定して、新しいサンプルサイズで実行をクリックします。新しいサンプルサイズを特定のポイント(データセットのサイズによって決定)以上に設定すると、フローズン実行が強制されます。フローズン実行なしで大規模なデータセットのサンプルサイズを増やすには、リポジトリから新しいモデルを作成します。この方法では多くのRAMが使用されるため、システムパフォーマンスに影響することがあります。

アンサンブルモデル

アンサンブルでは、複数モデルの予測を結合できるため、モデルを単独で実行するよりも結果が改善する場合が多くなります。オートパイロットの実行時には自動的にアンサンブルモデルが作成されます

アンサンブルモデルを作成する目的

アンサンブルモデルを作成する前に、以下について考慮する必要があります。

  • 異なるアルゴリズムと高い精度を持つモデルをアンサンブルすることをお勧めします。
  • アンサンブルによって、多くの場合精度は高まりますが、作成とスコアリングにかかる時間も増えます。
  • 最終的なモデルが複雑になるため、アンサンブルモデルの解釈と説明はより困難になります。解釈タブのインサイトをご覧になれば、モデルの解釈について理解を深めることができます。

DataRobotは、非時間認識プロジェクトで以下のアンサンブル方法をサポートします:

アンサンブル プロジェクトタイプ 備考
平均アンサンブル(AVG) 連続値、二値分類、多クラス N/A
中央値アンサンブル(MED) 連続値、二値分類、多クラス N/A
部分最小二乗法アンサンブル(PLS) 連続値、二値分類 サイズの大きいデータセットでは使用できません(スリム実行)
Generalized Linear Modelアンサンブル(GLM) 連続値、二値分類 サイズの大きいデータセットでは使用できません(スリム実行)
Elastic Netアンサンブル(ENET) 連続値、二値分類、多クラス サイズの大きいデータセットでは使用できません(スリム実行)
平均絶対誤差最小化加重平均アンサンブル(MAE) 連続値 プロジェクト指標としてMAEを使用するプロジェクトでのみ使用できます。大きいデータセットでは使用できません(スリム実行)
L1ペナルティを使用した平均絶対誤差最小化加重平均アンサンブル(MAEL1) 連続値 プロジェクト指標としてMAEを使用するプロジェクトでのみ使用できます。大きいデータセットでは使用できません(スリム実行)
ランダムフォレストアンサンブル(RF) 多クラス サイズの大きいデータセットでは使用できません(スリム実行)
TensorFlowアンサンブル(TF) 連続値、二値分類、多クラス サイズの大きいデータセットでは使用できません(スリム実行)
Light Gradient Boosting Machineアンサンブル(LGBM) 連続値、二値分類、多クラス サイズの大きいデータセットでは使用できません(スリム実行)
高度な平均アンサンブル(高度なAVG) 連続値、二値分類、多クラス オートパイロットによってのみ実行できます。大きいデータセットでは使用できません(スリム実行)
高度なGeneralized Linear Modelアンサンブル(Advanced GLM) 連続値、二値分類 オートパイロットによってのみ実行できます。大きいデータセットでは使用できません(スリム実行)
高度なElastic Netアンサンブル(高度なENET) 連続値、二値分類、多クラス オートパイロットによってのみ実行できます。大きいデータセットでは使用できません(スリム実行)
単一モデルアンサンブル

単一モデルアンサンブルの手順は「校正」手順と類似しています。校正とは、予測された確率値の分布と動作をトレーニングデータで観測された確率値の分布と動作に近似するように、DataRobotがモデルを改善する試みです。

GLM、ENET、PLSのアンサンブルは、切片および係数を学習します。つまり、「すべての予測に数値を加算」し、「すべての予測に数値を乗算」します。単純な加算または乗算によって、モデルの結果が若干改善することがあります。トレーニングが必要なアンサンブル(AVGとMEDを除くすべて)は、スタッキングを使用してアウトオブサンプルの予測を保証します(そして誤解を招きかねないほど高い精度を回避します)。LGBMまたはTFモデル全体が単一の予測入力に適合し、そこから単一予測の複雑な非線形変換を学習できます。AVGおよびMEDのアンサンブルの場合は、単一モデルのアンサンブルの作成は、親モデルの完全な複製となるため、有用ではありません。

時間認識プロジェクトのアンサンブルについては、以下を参照してください。

各ターゲットポイントに対し、平均および中央値アンサンブルは、選択された個々のモデルの予測値の平均や中央値を計算します。GLM、Elastic Net、PLSアンサンブルは、既存のモデルの上にある第二のレイヤーと言うことができます。選択されたモデルの予測を予測変数として使用し、同時に個々のモデルと同じターゲットを維持します。

アンサンブルモデルの作成

アンサンブルモデルを作成するには以下の手順で行います。

  1. モデルのリーダーボード左側にあるチェックボックスを使用し、2つ以上のモデルを選択します。(追加の校正手段としてアンサンブルを使用するには、上記の単一モデルアンサンブルに関する備考を参照してください。)

  2. リーダーボードの左上にあるモデルメニューアイコンをクリックし、アンサンブルの下にリスト表示されているアンサンブルオプションの1つを選択します。(メニュー項目の上にカーソルを合わせると、アンサンブルオプションの説明が表示されます。)

  3. 新しいジョブがワーカーキューに表示され、同時にアンサンブルモデルが処理されます。名前は、アンサンブルを作成するために選択したアンサンブルのタイプやモデルを示します。

処理が完了すると、新しいアンサンブルモデルがリーダーボードのリストに表示されます。

新しいサンプルサイズおよび別の特徴量セットを使用して、アンサンブル済みモデルを再実行できます。アンサンブル済みモデルのチェックボックスを選択し、メニューから「選択したモデルを実行」を選択します。モデルを実行を選択する前に、必要な変更を加えます。

リーダーボードから特徴量セットとサンプルサイズに変更を加えることもできます。

時間認識プロジェクトのアンサンブル

時間認識モデルでは、スタックされた予測を使用しないため、異なるアンサンブルを使用することができます。

アンサンブル(コード) プロジェクトタイプ 説明
平均アンサンブル(AVG) OTV、時系列 異なるモデル間の予測の平均値
中央値アンサンブル(MED) OTV、時系列 異なるモデル間の予測の中央値
予測距離での平均アンサンブル(FD_AVG) 時系列 選択したモデルから、上位3モデルの予測距離ごとの平均値が提供されます。2つ以上の予測距離を含むプロジェクトでのみ使用できます。予測距離によってアンサンブルを行うには、少なくとも4つのモデルを選択する必要があります。
予測距離でのENETアンサンブル(FD_ENET) 時系列 予測を組み合わせるための予測距離ごとのElastic Netモデル。2つ以上の予測距離を含むプロジェクトでのみ使用できます。

短期予測(数ステップ先の未来)に優れたモデルがある一方で、長期予測(さらに先の未来)に優れたモデルもあるため、時系列プロジェクトでは、予測距離アンサンブルオプションが追加されます。予測距離アンサンブルでは、個々の予測距離に最適なブループリントを使用するために、予測距離ごとに別のモデルがアンサンブルされます。

以下の点に注意してください。

  • 予測距離が1に等しい場合、予測距離アンサンブルは無効化されます。

  • 予測距離での平均アンサンブルを使用する場合、4つ以上のモデルを選択する必要があります。選択したモデルが4つ未満の場合、アンサンブルは予測距離に基づく予測ではなく、モデルの予測値を平均化します。

選択したモデルの実行

モデルが作成され、リーダーボードに表示された後、選択したモデルは他の設定を使って再トレーニングすることができます。別の特徴量セットやサンプルサイズを使用して実行することや、一次分割または最大5次分割までの交差検定を選択することができます。

備考

選択したモデルを実行は、アンサンブルモデルに使用することはできません。

以下の手順を用いて、選択した1つまたは複数のモデルを実行します。

  1. リーダーボードで、モデル名の左側にあるチェックボックスを使用して、1つまたは複数のモデルを選択します。

  2. リーダーボードの左上にあるモデルメニューアイコンをクリックし、選択したモデルを実行を選択します。

  3. リーダーボードの上部に表示されるボックスを使用して、特徴量セット、サンプルサイズ、および交差検定(CV)の実行回数を指定します。

  4. 選択したモデルと指定されたパラメーターを再トレーニングするには、タスクの実行をクリックします。DataRobotでモデルが処理される間、ワーカーキューに新しいジョブが表示されます。

モデルの削除

以下の手順を使用して、リーダーボードに一覧表示されているモデルを削除できます。この方法でモデルを削除すると、モデルはリーダーボードから削除されますが、基になるプロジェクトのデータベースからは削除されません。そのため、モデルは引き続き親プロジェクトのコンポーネント(アンサンブルモデルやワードクラウドなど)で使用できます。

モデルを削除するには

  1. モデルのリーダーボード左側にあるチェックボックスを使用して、1つまたは複数のモデルを選択します。

  2. リーダーボードの左上にあるモデルメニューアイコンをクリックします。

  3. 選択したモデルを削除をクリックします。

  4. 削除をクリックしてモデルの削除を確定します。


更新しました April 19, 2022
Back to top