NextGen UIに関するドキュメント > ワークベンチ > 予測エクスペリメント > エクスペリメントを管理 > モデルリーダーボード

モデルリーダーボード¶

タイル	説明
	モデルの利用可能なインサイトおよびアクションへのアクセスとともに、構築されたすべてのモデルとそれぞれの概要情報のリストを開きます。

モデリングを開始すると、ワークベンチでは、モデルリーダーボードの構築が開始されます。リーダーボードでは、モデルがパフォーマンス順にランク付けされるので、モデルの迅速な評価に役立ちます。リーダーボードには、エクスペリメントで構築された各モデルについてのスコアリング情報を含む情報のサマリーが表示されます。リーダーボードからモデルをクリックすると、視覚化にアクセスしてさらに詳しく調べたり、エクスペリメントをさらに改善するためのアクションを実行したりすることができます。これらのツールを使用すると、次のエクスペリメントで何をする必要があるかを評価するのに役立ちます。

DataRobotは、リーダーボードを構築する際にモデルを入力し、最初は最大50のモデルを表示します。 追加のモデルをロードをクリックすると、クリックするたびに50のモデルが読み込まれます。

クイックモードを実行した場合、ワークベンチでサンプルサイズフェーズが64%完了すると、最も精度の高いモデルが選択され、100%のデータでトレーニングされます。そのモデルには、デプロイの準備済みバッジが付けられます。

デプロイの準備済みモデルがリーダーボードの先頭に表示されないのはなぜですか？

ワークベンチでデプロイするモデルが準備されると、100%のデータでモデルがトレーニングされます。最も精度の高いものが準備対象として選択されましたが、64%のサンプルサイズに基づいて選択されたものです。デプロイ用の最も精度の高いモデルの準備の一環として、ワークベンチはホールドアウトのロックを解除し、準備されたモデルを元のデータとは異なるデータでトレーニングします。リーダーボードをホールドアウトで並べ替えるように変更しない場合、左側のバーの検定スコアは、準備されたモデルが最も正確ではないかのように表示されます。

リーダーボードは、以下の3つの基本要素で構成されています。

リーダーボード自体。エクスペリメントで構築されたすべてのモデルの管理可能なリストです。
サマリー情報とモデルインサイトへのアクセスを提供するモデルの概要ページ。
アクションメニュー。ここでは、エクスペリメントや特定のモデルをすばやく操作できます。

モデルリスト¶

デフォルトでは、リーダーボードは展開された全幅表示で開き、エクスペリメント内のすべてのモデルとそのトレーニング設定の概要、および検定、交差検証、ホールドアウトの各スコアが表示されます。バッジによって、モデルの識別とスコアリングに関する情報をすばやく確認でき、モデル名の前のアイコンはモデルタイプを示します。表示を変更して、目的のモデルを見つけやすくすることもできます。

任意のモデルをクリックすると、さらにスコアリング情報が表示され、モデルのインサイトにアクセスできます。 閉じるをクリックすると、全幅表示に戻ります。

リーダーボードに表示可能な数を超えるバッジがモデルにある場合は、ドロップダウンを使用します。

表示の制御¶

リーダーボードのモデル一覧をフィルターや並べ替えすることで、関連するモデルを簡単に見つけたり、注目したりできるようになります。具体的には、検索、フィルター、並べ替え、モデルの「お気に入り登録」といった機能があります。

検索¶

検索のフィルターには、任意のフィルターを組み合わせることができます。まず、モデルタイプやブループリント番号などを検索し、次に「フィルター」を選択して、そのタイプのモデルの中から、追加の条件を満たすモデルのみを検索します。

モデルのフィルター¶

フィルターを使用すると、関連するモデルの表示とフォーカスが容易になります。 フィルターをクリックして、ワークベンチのリーダーボードに表示されるモデルの条件を設定します。各フィルターで使用できる選択は、エクスペリメントおよびモデルタイプ（少なくとも1つのリーダーボードモデルで使用されたタイプ）に依存し、モデルがエクスペリメントに追加されると変更される可能性があります。例：

フィルター	表示内容
ラベルが設定されたモデル	指定されたタグが割り当てられているモデル、つまりスター付きモデルまたはデプロイが推奨されているモデル。
特徴量セット	選択された特徴量セットを用いて構築されたモデル。
サンプルサイズ（ランダムまたは層化抽出パーティション）	選択されたサンプルサイズでトレーニングされたモデル。
トレーニング期間（日付/時刻パーティション）	選択された期間メカニズムによって定義されたバックテストでトレーニングされたモデル。
モデルファミリー	選択したモデルファミリーの一部であるモデル： GBM（Gradient Boosting Machine）。Light Gradient Boosting on ElasticNet Predictions、eXtreme Gradient Boosted Trees Classifierなど GLMNET（Lasso and Elastic-Net Regularized Generalized Linear Models）。Elastic-Net Classifier、Generalized Additive2など RI（Rule Induction）。RuleFit Classifierなど RF（Random Forest）。RandomForest ClassifierやRegressorなど NN（Neural Network）。Kerasなど
プロパティ	GPUを使用して構築されたモデル。

使用可能なフィールドとそのフィールドの設定は、プロジェクトやモデルタイプによって異なります。たとえば、日付/時刻以外のモデルではサンプルサイズでのフィルターが可能ですが、時間認識モデルではトレーニング期間を設定できます。

備考

フィルターは包括的です。つまり、すべてのフィルターではなく、いずれかのフィルターに一致するモデルが結果として表示されます。また、選択可能なオプションには、基準に一致するモデルが少なくとも1 つリーダーボードにあるものを含めます。

モデルの並べ替え¶

デフォルトでは、リーダーボードは、選択した最適化指標を使用して、検定パーティションのスコアに基づいてモデルをソートします。ただし、モデルの並べ替え条件コントロールを使用すれば、モデルを評価する際の表示基準を変更することができます。具体的には、評価指標やパーティション、あるいはその両方を変更することが可能です。外部テストセットが追加されている場合のみ、外部テストデータのパーティションが表示されます。

ワークベンチでは、データにとって最適な指標を使用してプロジェクトが構築されていますが、各モデルに適用される多くの指標が計算されることに注意してください。構築が完了した後、別の指標に基づいてリーダーボードのリストを再表示できます。モデル内の値は変更されませんが、この代替指標でのパフォーマンスに基づいてモデルの一覧の表示順序が変更されます。

各指標の詳細については、最適化指標のページを参照してください。

お気に入りでフィルター¶

リーダーボードに表示される1つまたは複数のモデルにタグ（星）を付けて、アプリケーションをナビゲートするときにモデルを容易に参照できます。クリックして星を付けてから、フィルターを使用すると、星付きモデルのみが表示されます。

モデル概要¶

リーダーボードのリストからモデルを選択すると、モデル概要が表示され、以下の操作が可能です。

指標スコアと設定に関する特定の詳細を確認する。
新しい特徴量セットまたはサンプルサイズでモデルを再トレーニングする。デプロイの準備済みモデルの特徴量セットは、「フローズン」実行であるため変更できません。
モデルのインサイトにアクセスする。

モデル構築の失敗¶

モデルの構築に失敗した場合、オートパイロットの実行中にジョブキューにその旨が表示されます。完了すると、そのモデルはリーダーボードに表示されますが、失敗したことが示されます。モデルをクリックすると、失敗の原因となった問題のログが表示されます。

リーダーボードからモデルを削除するには、失敗したモデルを削除ボタンを使用します。

リーダーボードのアクション¶

リーダーボードからモデルにアクセスできるほか、以下の操作も可能です。

モデリングを再実行し、異なる特徴量セットやモデリングモード、あるいは追加の自動化設定でオートパイロットを再起動します。
エクスペリメントを複製します。
外部のテストデータを追加し、モデルの精度と予測結果を比較します。
選択したモデルをブレンドしてアンサンブルモデルを作成します。これにより、各モデルの予測を組み合わせることで精度が向上する可能性があります。
選択したモデルを削除します。

エクスペリメントの複製¶

アクションメニューから、エクスペリメントを複製を選択すると、現在のエクスペリメントのコピーを（新しいエクスペリメントとして）作成できます。これは、データを再アップロードするよりも、データ処理を迅速に行う方法となります。エクスペリメントを複製すると、モーダルが開き、新しいエクスペリメント名を入力するオプションが表示されます。次に、データセットだけをコピーするか、データセットとエクスペリメント設定をコピーするかを選択します。設定を含めることを選択した場合、ターゲット、および元のプロジェクトに関連付けられた詳細設定とカスタム特徴量セットが複製されます。

完了すると、新しいエクスペリメント設定ページが開き、モデル構築プロセスを開始できます。

モデルをアンサンブル¶

ブレンダーモデルでは、2つから最大8つのモデルの予測を組み合わせることで、精度を向上させることができます。

レスポンス時間の最適化

アンサンブルモデルのレスポンス時間を改善するために、DataRobotは、オートパイロットによって使用される最大サンプルサイズ（通常64%）でトレーニングされた全モデルの予測を保存し、それらの結果からアンサンブルを作成します。最大のサンプルサイズのみを保存することで（したがって、パフォーマンスが最も高いモデルの予測のみを保存することで）、必要なディスク容量を抑制できます。

ブレンダーモデルを作成するには：

リーダーボードから、ブレンドするモデルを2つ以上、最大8つ選択します。
アクションメニューから、選択されたモデルをアンサンブルを選択します。以下の場合、このオプションは使用できません。
- エクスペリメントが除外されたモデルまたはエクスペリメントタイプである。
- ブレンドするモデルを選択しすぎた。
- 選択したモデルの予測距離がそれぞれ異なる（時間認識エクスペリメント）。
- モデルのアクションが、このロールではサポートされていない。
モデルをアンサンブルモーダルが開き、選択したモデルでサポートされている方法のリストが表示されます。選択した各リーダーボードモデルから新しいブレンダーモデルを作成する方法を選択し、クリックしてトレーニングします。利用可能な方法の詳細については、ブレンド方法のリファレンスを参照してください。

トレーニングが完了すると、新しいブレンドモデルがリーダーボード上のリストに表示されます。

ブレンド方法¶

以下の表に、ブレンド方法とその簡単な説明、およびその方法を利用できるエクスペリメントタイプを示します。

利用可能なブレンド方法

方法	説明
平均アンサンブル（AVG）	複数のベースモデルの予測平均値を組み合わせる際に、出力値の単純な算術平均（連続値の場合）または予測された確率の平均（分類の場合）を算出します。
ElasticNet Blend (ENET)	複数のベースモデルからの予測を平均するのではなく、組み合わせるための最適な重みを学習します。 ElasticNetのL1およびL2正則化は、オーバーフィッティングを防ぎながら、最も価値のあるモデルを選択するのに役立ちます。
Generalized Linear Modelアンサンブル（GLM）	複数のベースモデルの予測値を組み合わせます。ここで、ベースモデルの予測値は入力特徴量として使われ、GLMは線形加重を学習します。
Maximum Blend (MAX)	複雑なアルゴリズム（たとえば、ニューラルネットワーク、勾配ブースティング、多層スタッキング）を用いて、ベースモデルの予測値の複雑で非線形の組み合わせを学習します。
Mean Absolute Error (MAE)	ベースモデルの予測値を組み合わせる際の最適な重みを、ブレンド中に平均絶対誤差損失関数を最小化することで学習します。これは、通常の2乗誤差ベースのブレンダーとは異なり、外れ値に対してより堅牢です。
Mean Absolute Error 1 (MAE1)	ベースモデルの予測値を組み合わせる際の最適な重みを、ブレンド中に平均絶対誤差損失関数を最小化することで学習し、L1正則化を適用します。これは、通常の2乗誤差ベースのブレンダーとは異なり、外れ値に対してより堅牢です。
Minimum Blend (MIN)	平均化（連続値の場合）や多数決（分類の場合）といった基本的な集計方法を使用して、複数のベースモデルの予測値を組み合わせます。これは学習された重みや複雑な組み合わせルールを使用しない、基本的なアンサンブル手法です。
中央値アンサンブル（MED）	複数のベースモデルの予測値を組み合わせる際に、出力の中央値（連続値の場合）または予測された確率の中央値（分類の場合）を取ります。 MED Blendは、中央値が極端な予測値の影響を受けにくいため、平均ベースのブレンドよりも外れ値に対して堅牢です。
部分最小二乗法アンサンブル（PLS）	PLS回帰を使用して、ターゲット特徴量との共分散を最大化する、基本モデルの予測値の線形組み合わせを見つけることにより、複数の基本モデルの予測値を結合します。基本モデルの予測値を独立した特徴量として扱う単純な線形ブレンドとは異なり、PLSは特に、ターゲットと最大限に相関しながら、モデル間で共有される予測情報を捉える潜在要素を探します。
予測距離での平均アンサンブル	時間認識。予測距離ごとに、各モデルの予測の平均値をアンサンブルしたモデルを作成
予測距離でのENETアンサンブル	時間認識。予測距離ごとに、選択されたモデルの予測値に対してElasticNetモデルをトレーニングするモデルを作成します。

備考

DataRobotには、自然言語処理（NLP）および画像のファインチューナーモデル用に特別なロジックが用意されています。たとえば、ファインチューナーはスタックされた予測をサポートしていません。その結果、スタックモデルとスタック非対応モデルを組み合わせてブレンドする場合、利用可能なブレンド方法はAVG、MED、MIN、またはMAXです。この場合、DataRobotは他の方法をサポートしません。ターゲットリーケージが発生する可能性があるためです。

ブレンダー機能に関する注意事項¶

以下のモデルタイプまたは状況では、モデルをブレンダーに含めることができません。

Custom tasks (model features are not supported in NextGen).
10を超えるクラスの拡張多クラスと多ラベルエクスペリメント。
教師なし予測または時間認識クラスタリングエクスペリメント。
ブレンダーモデル（以前のブレンダーアクションの結果として生成されたモデル）。
レジストリのワークショップで作成されたカスタムモデル。
失敗したモデル。
使用非推奨および無効なモデル。

モデル リーダーボード¶