Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

フローズン実行

サンプルでモデルのパフォーマンスチューニングをするため、DataRobotは多くのパラメーターの組み合わせを体系立てて適用し、最適なモデルの探索を徐々に絞り込みます。しかしながら多くのパラメーターの組み合わせを試すことはコストがかかります。サンプルサイズが増えるにつれ、各モデルに最適なハイパーパラメーター設定を見つけるためのグリッド検索に必要な時間は飛躍的に増加します。

DataRobotの「フローズン実行」機能は、モデルの初期のサンプルサイズが小さい実行からパラメーター設定を「凍結」することでこれに対処します。より小さなサンプルに基づくパラメーター設定であっても、同じデータのより大きなサンプルに対して機能する傾向があるため、DataRobotは初期段階の実験をうまく活用しています。初期段階で成功したパラメーター設定を活用し、トレーニングを実施したかのように新しいモデルへ投入することで、モデルの正確性やパフォーマンスが大きく損なわれることなく、時間、RAMおよびCPUリソースを節約できます。このようにリソースを節約することは、巨大なデータセットを扱う場合やリソースに制限のあるシステムで作業する場合においては特に重要です。

大規模データセット(1.5GB以上)でコストのかかる実行を避けるため、各リーダーボードモデルに対しては「フローズン実行」でサンプル割合だけを変更させた実行が可能です。スマートダウンサンプリングを使用している場合、サブサンプリング後のデータセットのサイズにしきい値が適用されます。

フローズン実行の開始

パラメーターのフローズン実行は、以前に決定されたパラメーターに依存するため、リーダーボード上の既存モデルからのみ起動することができます。フローズン実行機能を使うには以下の手順に従います。

  1. オートパイロットを実行するか、手動モードでモデルを構築します。妥当な時間(ご利用のシステムリソースとデータセットによります)で完了するサンプルサイズを使用しますが、パラメーター最適化検索が適切なパラメーター値を識別できないほど小さいサイズは避けます。

  2. モデルの構築が完了したら、モデルのリーダーボードを開きます。

  3. より多くのデータを用いてモデルを再実行したい場合は、表示されたサンプルサイズの横にあるプラス記号をクリックします。

  4. 新しいサンプルサイズを設定し、スノーフレークアイコンをクリックします。

    次のいずれかの方法を使用して、サンプルサイズを更新します。

    • 割合値(パーセントフィールド)または行数(行数フィールド)を入力します。
    • スライダーを使用して、視覚的なインジケーターに基づいて値を設定します。
    • 実行先ボックスをクリックして、トレーニングおよびその他の重要な値に使用されるデフォルトの割合にすばやくアクセスします。

    サンプルサイズを更新すると、すべての値が調整されます。

  5. 新しいサンプルサイズで実行をクリックして、新しく設定したサンプルサイズで選択したモデルのパラメーター設定を使用して、モデルの構築を開始します。

フローズン実行されたリーダーボード上のアイテムは、スノーフレークアイコンと共に表示され、パラメーターを取得するために使用されるサンプルパーセンテージが、そのアイコンの隣に表示されます。

フローズン実行モデルの比較

モデルの作成が完了したら、その処理速度とリソースを改善することが精度変化に伴う潜在的コスト増に値するかどうかを判断する必要があります。新しいモデルは、リーダーボードに表示されます。

  • スノーフレーク(1): このアイコンおよびパーセンテージは、そのモデルが、そのモデルの64%サンプルサイズバージョンから取られた「凍結」パラメーター設定に基づいていることを示します。
  • サンプルサイズ(2): サンプルサイズは常に、モデルの構築に使用されたトレーニングデータセットのパーセンテージを示します。この例では、50%に再トレーニングされた64%のモデルを示します。

以下を比較します:

モデル間の精度を比較するには、測定したい値に指標を設定し、検定スコアを確認します。

新しく作成されたモデルをクリックし、次にモデル情報タブをクリックします。その結果のページには、コア使用、RAM、構築時間とその他の統計の詳細を示すリソース使用サマリー、およびサンプルとモデルのファイルサイズの詳細が表示されます。

これらの画面の情報を、速度と精度の要件という両方の観点から比較してください。

スマートダウンサンプリングプロジェクトのモデル情報タブの下にあるサンプルサイズタイルの行数(「行」)は、ダウンサンプリング後の行数を示していますのでご注意ください。しかし、トレーニングデータおよびテストデータのサイズには、ダウンサンプリング前の行数がリストされます。


更新しました March 1, 2022
Back to top