Skip to content

モデル リーダーボード

タイル 説明
Opens a list of all built models and overview information for each, with access to the model's available insights and actions.

モデリングを開始すると、ワークベンチでは、モデルリーダーボードの構築が開始されます。リーダーボードでは、モデルがパフォーマンス順にランク付けされるので、モデルの迅速な評価に役立ちます。 リーダーボードには、エクスペリメントで構築された各モデルについてのスコアリング情報を含む情報のサマリーが表示されます。 From the Leaderboard, you can click a model to access visualizations for further exploration or take actions to further refine the experiment. これらのツールを使用すると、次のエクスペリメントで何をする必要があるかを評価するのに役立ちます。

DataRobotは、リーダーボードを構築する際にモデルを入力し、最初は最大50のモデルを表示します。 追加のモデルをロードをクリックすると、クリックするたびに50のモデルが読み込まれます。

クイックモードを実行した場合、ワークベンチでサンプルサイズフェーズが64%完了すると、最も精度の高いモデルが選択され、100%のデータでトレーニングされます。 そのモデルには、デプロイの準備済みバッジが付けられます。

デプロイの準備済みモデルがリーダーボードの先頭に表示されないのはなぜですか?

ワークベンチでデプロイするモデルが準備されると、100%のデータでモデルがトレーニングされます。 最も精度の高いものが準備対象として選択されましたが、64%のサンプルサイズに基づいて選択されたものです。 デプロイ用の最も精度の高いモデルの準備の一環として、ワークベンチはホールドアウトのロックを解除し、準備されたモデルを元のデータとは異なるデータでトレーニングします。 リーダーボードをホールドアウトで並べ替えるように変更しない場合、左側のバーの検定スコアは、準備されたモデルが最も正確ではないかのように表示されます。

Three basic elements make up the Leaderboard:

  • リーダーボード自体。エクスペリメントで構築されたすべてのモデルの管理可能なリストです。
  • サマリー情報とモデルインサイトへのアクセスを提供するモデルの概要ページ。
  • The Actions menu, where you can quickly interact with the experiment or specific models.

モデルリスト

デフォルトでは、リーダーボードは展開された全幅表示で開き、エクスペリメント内のすべてのモデルとそのトレーニング設定の概要、および検定、交差検証、ホールドアウトの各スコアが表示されます。 バッジによって、モデルの識別とスコアリングに関する情報をすばやく確認でき、モデル名の前のアイコンはモデルタイプを示します。 You can also change the display to more easily locate models of interest.

任意のモデルをクリックすると、さらにスコアリング情報が表示され、モデルのインサイトにアクセスできます。 閉じるをクリックすると、全幅表示に戻ります。

リーダーボードに表示可能な数を超えるバッジがモデルにある場合は、ドロップダウンを使用します。

Control the display

There are a variety of ways to filter and sort the Leaderboard model list to make viewing and focusing on relevant models easier—search, filter, sort, and "favorite" models.

検索のフィルターには、任意のフィルターを組み合わせることができます。 まず、モデルタイプやブループリント番号などを検索し、次に「フィルター」を選択して、そのタイプのモデルの中から、追加の条件を満たすモデルのみを検索します。

モデルのフィルター

フィルターを使用すると、関連するモデルの表示とフォーカスが容易になります。 フィルターをクリックして、ワークベンチのリーダーボードに表示されるモデルの条件を設定します。 各フィルターで使用できる選択は、エクスペリメントおよびモデルタイプ(少なくとも1つのリーダーボードモデルで使用されたタイプ)に依存し、モデルがエクスペリメントに追加されると変更される可能性があります。 例:

フィルター Displays
ラベルが設定されたモデル Models that have been assigned the listed tag, either starred models or models recommended for deployment.
特徴量セット Models that were built with the selected feature list.
サンプルサイズ(ランダムまたは層化抽出パーティション) Models that were trained on the selected sample size.
トレーニング期間(日付/時刻パーティション) Models that were trained on backtests defined by the selected duration mechanism.
モデルファミリー Models that are part of the selected model family:
  • GBM (Gradient Boosting Machine), such as Light Gradient Boosting on ElasticNet Predictions, eXtreme Gradient Boosted Trees Classifier
  • GLMNET (Lasso and ElasticNet regularized generalized linear models), such as Elastic-Net Classifier, Generalized Additive2
  • RI (Rule induction), such as RuleFit Classifier
  • RF (Random Forest), such as RandomForest Classifier or Regressor
  • NN (Neural Network), such as Keras
プロパティ Models that were built using GPUs.

使用可能なフィールドとそのフィールドの設定は、プロジェクトやモデルタイプによって異なります。 たとえば、日付/時刻以外のモデルではサンプルサイズでのフィルターが可能ですが、時間認識モデルではトレーニング期間を設定できます。

備考

フィルターは包括的です。 つまり、すべてのフィルターではなく、いずれかのフィルターに一致するモデルが結果として表示されます。 また、選択可能なオプションには、基準に一致するモデルが少なくとも1 つリーダーボードにあるものを含めます。

モデルの並べ替え

デフォルトでは、リーダーボードは、選択した 最適化指標を使用して、検定パーティションのスコアに基づいてモデルをソートします。 You can, however, use the Sort models by control to change the basis of the display parameter when evaluating models&emdashchanging the metric, the partition, or both. The external test data partition only displays if an external test set was added.

ワークベンチでは、データにとって最適な指標を使用してプロジェクトが構築されていますが、各モデルに適用される多くの指標が計算されることに注意してください。 構築が完了した後、別の指標に基づいてリーダーボードのリストを再表示できます。 モデル内の値は変更されませんが、この代替指標でのパフォーマンスに基づいてモデルの一覧の表示順序が変更されます。

See the page on optimization metrics for detailed information on each metric.

お気に入りでフィルター

リーダーボードに表示される1つまたは複数のモデルにタグ(星)を付けて、アプリケーションをナビゲートするときにモデルを容易に参照できます。 クリックして星を付けてから、フィルターを使用すると、星付きモデルのみが表示されます。

モデル概要

リーダーボードのリストからモデルを選択すると、モデル概要が表示され、以下の操作が可能です。

モデル構築の失敗

モデルの構築に失敗した場合、オートパイロットの実行中にジョブキューにその旨が表示されます。 完了すると、そのモデルはリーダーボードに表示されますが、失敗したことが示されます。 モデルをクリックすると、失敗の原因となった問題のログが表示されます。

リーダーボードからモデルを削除するには、失敗したモデルを削除ボタンを使用します。

Leaderboard actions

リーダーボードからモデルにアクセスできるほか、以下の操作も可能です。

エクスペリメントの複製

From the Actions menu , choose Duplicate experiment to make a copy of the current experiment (as a new experiment). This can be a faster way to work with your data rather than re-uploading it. When you duplicate an experiment, a modal opens with an option to provide a new experiment name. 次に、データセットだけをコピーするか、データセットとエクスペリメント設定をコピーするかを選択します。 設定を含めることを選択した場合、ターゲット、および元のプロジェクトに関連付けられた詳細設定とカスタム特徴量セットが複製されます。

完了すると、新しいエクスペリメント設定ページが開き、モデル構築プロセスを開始できます。

モデルをアンサンブル

ブレンダーモデルでは、2つから最大8つのモデルの予測を組み合わせることで、精度を向上させることができます。

レスポンス時間の最適化

アンサンブルモデルのレスポンス時間を改善するために、DataRobotは、オートパイロットによって使用される最大サンプルサイズ(通常64%)でトレーニングされた全モデルの予測を保存し、それらの結果からアンサンブルを作成します。 最大のサンプルサイズのみを保存することで(したがって、パフォーマンスが最も高いモデルの予測のみを保存することで)、必要なディスク容量を抑制できます。

ブレンダーモデルを作成するには:

  1. リーダーボードから、ブレンドするモデルを2つ以上、最大8つ選択します。

  2. アクションメニューから、選択されたモデルをアンサンブルを選択します。 以下の場合、このオプションは使用できません。

  3. モデルをアンサンブルモーダルが開き、選択したモデルでサポートされている方法のリストが表示されます。 選択した各リーダーボードモデルから新しいブレンダーモデルを作成する方法を選択し、クリックしてトレーニングします。 利用可能な方法の詳細については、ブレンド方法のリファレンスを参照してください。

    トレーニングが完了すると、新しいブレンドモデルがリーダーボード上のリストに表示されます。

ブレンド方法

以下の表に、ブレンド方法とその簡単な説明、およびその方法を利用できるエクスペリメントタイプを示します。

利用可能なブレンド方法
方法 説明
平均アンサンブル(AVG) 複数のベースモデルの予測平均値を組み合わせる際に、出力値の単純な算術平均(連続値の場合)または予測された確率の平均(分類の場合)を算出します。
ElasticNet Blend (ENET) 複数のベースモデルからの予測を平均するのではなく、組み合わせるための最適な重みを学習します。 ElasticNetのL1およびL2正則化は、オーバーフィッティングを防ぎながら、最も価値のあるモデルを選択するのに役立ちます。
Generalized Linear Modelアンサンブル(GLM) 複数のベースモデルの予測値を組み合わせます。ここで、ベースモデルの予測値は入力特徴量として使われ、GLMは線形加重を学習します。
Maximum Blend (MAX) 複雑なアルゴリズム(たとえば、ニューラルネットワーク、勾配ブースティング、多層スタッキング)を用いて、ベースモデルの予測値の複雑で非線形の組み合わせを学習します。
Mean Absolute Error (MAE) ベースモデルの予測値を組み合わせる際の最適な重みを、ブレンド中に平均絶対誤差損失関数を最小化することで学習します。 これは、通常の2乗誤差ベースのブレンダーとは異なり、外れ値に対してより堅牢です。
Mean Absolute Error 1 (MAE1) ベースモデルの予測値を組み合わせる際の最適な重みを、ブレンド中に平均絶対誤差損失関数を最小化することで学習し、L1正則化を適用します。 これは、通常の2乗誤差ベースのブレンダーとは異なり、外れ値に対してより堅牢です。
Minimum Blend (MIN) 平均化(連続値の場合)や多数決(分類の場合)といった基本的な集計方法を使用して、複数のベースモデルの予測値を組み合わせます。 これは学習された重みや複雑な組み合わせルールを使用しない、基本的なアンサンブル手法です。
中央値アンサンブル(MED) 複数のベースモデルの予測値を組み合わせる際に、出力の中央値(連続値の場合)または予測された確率の中央値(分類の場合)を取ります。 MED Blendは、中央値が極端な予測値の影響を受けにくいため、平均ベースのブレンドよりも外れ値に対して堅牢です。
部分最小二乗法アンサンブル(PLS) PLS回帰を使用して、ターゲット特徴量との共分散を最大化する、基本モデルの予測値の線形組み合わせを見つけることにより、複数の基本モデルの予測値を結合します。 基本モデルの予測値を独立した特徴量として扱う単純な線形ブレンドとは異なり、PLSは特に、ターゲットと最大限に相関しながら、モデル間で共有される予測情報を捉える潜在要素を探します。
予測距離での平均アンサンブル 時間認識。 予測距離ごとに、各モデルの予測の平均値をアンサンブルしたモデルを作成
予測距離でのENETアンサンブル 時間認識。 予測距離ごとに、選択されたモデルの予測値に対してElasticNetモデルをトレーニングするモデルを作成します。

備考

DataRobotには、自然言語処理(NLP)および画像のファインチューナーモデル用に特別なロジックが用意されています。 たとえば、ファインチューナーは スタックされた予測をサポートしていません。 その結果、スタックモデルとスタック非対応モデルを組み合わせてブレンドする場合、利用可能なブレンド方法はAVG、MED、MIN、またはMAXです。 この場合、DataRobotは他の方法をサポートしません。ターゲットリーケージが発生する可能性があるためです。

Blender feature considerations

以下のモデルタイプまたは状況では、モデルをブレンダーに含めることができません。