再トレーニングジョブをの作成¶
手動またはテンプレートから、コードベースの再トレーニングポリシーを実行するジョブを追加します。 再トレーニングジョブを表示および追加するには、ジョブ > 再トレーニングタブに移動し、以下の操作を行います。
-
新しい再トレーニングジョブを手動で追加するには、+ 新しい再トレーニングジョブを追加(またはジョブパネルが開いている場合は最小化された追加ボタン )をクリックします。
-
テンプレートから再トレーニングジョブを作成するには、追加ボタンの横にある をクリックし、再トレーニングの下にあるテンプレートから新規作成をクリックします。
新しいジョブがアセンブルタブに開きます。 選択した作成オプションに応じて、以下の表でリンクされている設定手順に進みます。
再トレーニングジョブタイプ | 説明 |
---|---|
新しい再トレーニングジョブを追加 | コードベースの再トレーニングポリシーを実装するジョブを手動で追加します。 |
テンプレートから新規作成 | DataRobotが提供するテンプレートからジョブを追加して、コードベースの再トレーニングポリシーを実装します。 |
再トレーニングジョブにはメタデータが必要
すべての再トレーニングジョブには、再トレーニングポリシーをデプロイおよび再トレーニングポリシーに関連付けるためのmetadata.yaml
ファイルが必要です。
新しい再トレーニングジョブを追加¶
コードベースの再トレーニングのジョブを手動で追加するには:
-
新しいジョブのアセンブルタブで、ジョブ名(または編集アイコン)をクリックして新しいジョブ名を入力してから、確認 をクリックします:
-
環境セクションで、ジョブの基本環境を選択します。
The available drop-in environments depend on your DataRobot installation; however, the table below lists commonly available public drop-in environments with templates in the DRUM repository. Depending on your DataRobot installation, the Python version of these environments may vary, and additional non-public environments may be available for use.
Drop-in environment security
Starting with the March 2025 Managed AI Platform release, most general purpose DataRobot custom model drop-in environments are security-hardened container images. When you require a security-hardened environment for running custom jobs, only shell code following the POSIX-shell standard is supported. Security-hardened environments following the POSIX-shell standard support a limited set of shell utilities.
Drop-in environment security
Starting with the 11.0 Self-Managed AI Platform release, most general purpose DataRobot custom model drop-in environments are security-hardened container images. When you require a security-hardened environment for running custom jobs, only shell code following the POSIX-shell standard is supported. Security-hardened environments following the POSIX-shell standard support a limited set of shell utilities.
環境名と例 Compatibility & artifact file extension Python 3.X Python-based custom models and jobs. You are responsible for installing all required dependencies through the inclusion of a requirements.txt
file in your model files.Python 3.X GenAI 生成AIモデル( Text Generation
またはVector Database
のターゲットタイプ)Python 3.X ONNX Drop-In ONNX models and jobs ( .onnx
)Python 3.X PMML Drop-In PMML models and jobs ( .pmml
)Python 3.X PyTorch Drop-In PyTorch models and jobs ( .pth
)Python 3.X Scikit-Learn Drop-In Scikit-Learn models and jobs ( .pkl
)Python 3.X XGBoost Drop-In Native XGBoost models and jobs ( .pkl
)Python 3.X Keras Drop-In Keras models and jobs backed by tensorflow ( .h5
)Javaドロップイン DataRobotスコアリングコードモデル( .jar
)ドロップイン環境 CARET( .rds
)を使ってトレーニングされたRモデル
CARETが推奨するすべてのライブラリをインストールするのに時間がかかるため、パッケージ名でもあるモデルタイプのみがインストールされます(例:brnn
、glmnet
)。 この環境のコピーを作成し、Dockerfileを修正して、必要なパッケージを追加でインストールします。 この環境をカスタマイズする際のビルド回数を減らすために、# Install caret models
セクションで不要な行を削除して、必要なものだけをインストールすることもできます。 CARETドキュメントを参照して、モデルの手法がパッケージ名と一致しているかどうかを確認してください。 このリンクをクリックする前にGitHubにログインしてください。scikit-learn
All Python environments contain scikit-learn to help with preprocessing (if necessary), but only scikit-learn can make predictions on
sklearn
models. -
ファイルセクションで、カスタムジョブを構築します。 ボックスにファイルをドラッグするか、このセクションのオプションを使用して、カスタムジョブの構築に必要なファイルを作成またはアップロードします。
オプション 説明 ソース/アップロードから選択 既存のカスタムジョブファイル( run.sh
、metadata.yaml
、など)をローカルファイルまたはローカルフォルダーとしてアップロードします。作成 空のファイルまたはテンプレートを含んだファイルとして新しいファイルを作成し、カスタムジョブに保存します。 - run.shを作成:エントリーポイントファイルの基本的で編集可能な例を作成します。
- metadata.yamlを作成:ランタイムパラメーターファイルの基本的で編集可能な例を作成します。
- README.mdを作成:基本的で編集可能なREADMEファイルを作成します。
- job.pyを作成:実行時のパラメーターとデプロイをプリントするための基本的で編集可能なPythonジョブファイルを作成します。
- サンプルジョブを作成:すべてのテンプレートファイルを結合して、基本的で編集可能なカスタムジョブを作成します。 簡単にランタイムパラメーターを設定し、このサンプルジョブを実行できます。
- 空白ファイルを作成:空のファイルを作成します。 名称未設定の横にある編集アイコン をクリックしてファイル名と拡張子を入力し、カスタムコンテンツを追加します。 次のステップでは、カスタム名とコンテンツを使用して、このように作成されたファイルをエントリーポイントとして識別できます。 新しいファイルを設定したら、保存をクリックします。
ファイルの置き換え
既存のファイルと同じ名前の新しいファイルを追加する場合、保存をクリックすると、ファイルセクションで古いファイルが置き換えられます。
-
設定セクションで、ジョブのエントリーポイントシェル(
.sh
)ファイルを設定します。run.sh
ファイルを追加した場合、そのファイルがエントリーポイントです。それ以外の場合は、ドロップダウンリストからエントリーポイントシェルファイルを選択する必要があります。 エントリーポイントファイルでは、複数のジョブファイルを調整できます。 -
リソースセクションのセクションヘッダーの横にある 編集をクリックして、以下を設定します。
プレビュー
カスタムジョブのリソースバンドルは、デフォルトではオフになっています。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。
機能フラグ:リソースのバンドルを有効にする
設定 説明 リソースバンドル プレビュー機能 カスタムジョブが実行に使用するリソースを設定します。 ネットワークアクセス カスタムジョブのエグレストラフィックを設定します。 ネットワークアクセスで、以下のいずれかを選択します。 - パブリック:デフォルト設定。 カスタムジョブは、パブリックネットワーク内の任意の完全修飾ドメイン名(FQDN)にアクセスして、サードパーティのサービスを利用できます。
- なし:カスタムジョブはパブリックネットワークから隔離され、サードパーティのサービスにアクセスできません。
デフォルトのネットワークアクセス
_マネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでパブリックに設定されていますが、変更可能です。 _セルフマネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでなしに設定されており、制限があります。ただし、管理者は、DataRobotプラットフォームの設定時にこれを変更できます。 詳細については、DataRobotの担当者または管理者にお問い合わせください。
-
(オプション)
metadata.yaml
ファイルをアップロードした場合は、設定したい各キー値の行の編集アイコン をクリックして、ランタイムパラメーターを定義します。 -
(オプション)タグ、指標、トレーニングパラメーター、アーティファクトに、追加の キー値を設定します。
テンプレートからの再トレーニングジョブの作成¶
テンプレートから事前に作成された再トレーニングジョブを追加するには:
プレビュー
ジョブテンプレートギャラリーは、デフォルトでオンになっています。
機能フラグ:カスタムジョブのテンプレートギャラリーを有効にする、カスタムテンプレートを有効にする
-
ギャラリーからカスタムジョブを追加パネルで、ジョブの作成に使用するテンプレートをクリックします。
-
ジョブの説明、実行環境、メタデータ、およびファイルを確認してから、カスタムジョブを作成をクリックします。
アセンブルタブにジョブが開きます。
-
新しいジョブのアセンブルタブで、ジョブ名(または編集アイコン())をクリックして新しいジョブ名を入力してから、確認 をクリックします:
-
環境セクションで、テンプレートで設定されたジョブの基本環境を確認します。
-
ファイルセクションで、テンプレートによってジョブに追加されたファイルを確認します。
-
編集アイコン をクリックすると、テンプレートによって追加されたファイルを変更できます。
-
削除アイコン をクリックすると、テンプレートによって追加されたファイルを削除できます。
-
-
新しいファイルを追加する必要がある場合は、このセクションのオプションを使用して、カスタムジョブの構築に必要なファイルを作成またはアップロードします。
オプション 説明 アップロード 既存のカスタムジョブファイル( run.sh
、metadata.yaml
、など)をローカルファイルまたはローカルフォルダーとしてアップロードします。作成 空のファイルまたはテンプレートを含んだファイルとして新しいファイルを作成し、カスタムジョブに保存します。 - run.shを作成:エントリーポイントファイルの基本的で編集可能な例を作成します。
- metadata.yamlを作成:ランタイムパラメーターファイルの基本的で編集可能な例を作成します。
- README.mdを作成:基本的で編集可能なREADMEファイルを作成します。
- job.pyを作成:実行時のパラメーターとデプロイをプリントするための基本的で編集可能なPythonジョブファイルを作成します。
- サンプルジョブを作成:すべてのテンプレートファイルを結合して、基本的で編集可能なカスタムジョブを作成します。 簡単にランタイムパラメーターを設定し、このサンプルジョブを実行できます。
- 空白ファイルを作成:空のファイルを作成します。 名称未設定の横にある編集アイコン()をクリックしてファイル名と拡張子を入力し、カスタムコンテンツを追加します。 次のステップでは、カスタム名とコンテンツを使用して、このように作成されたファイルをエントリーポイントとして識別できます。 新しいファイルを設定したら、保存をクリックします。
ファイルの置き換え
既存のファイルと同じ名前の新しいファイルを追加する場合、保存をクリックすると、ファイルセクションで古いファイルが置き換えられます。
-
設定セクションで、テンプレート(通常
.sh
)によって追加されたジョブのエントリーポイントシェル(run.sh
)ファイルを確認します。 エントリーポイントファイルでは、複数のジョブファイルを調整できます。 -
リソースセクションで、ジョブのデフォルトのリソース設定を確認します。 設定を変更するには、セクションヘッダーの横にある 編集をクリックし、以下のように設定します。
本機能の提供について
カスタムジョブのリソースバンドルは、デフォルトではオフになっています。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。
機能フラグ:リソースのバンドルを有効にする
設定 説明 リソースバンドル プレビュー機能 カスタムジョブが実行に使用するリソースを設定します。 ネットワークアクセス カスタムジョブのエグレストラフィックを設定します。 ネットワークアクセスで、以下のいずれかを選択します。 - パブリック:デフォルト設定。 カスタムジョブは、パブリックネットワーク内の任意の完全修飾ドメイン名(FQDN)にアクセスして、サードパーティのサービスを利用できます。
- なし:カスタムジョブはパブリックネットワークから隔離され、サードパーティのサービスにアクセスできません。
デフォルトのネットワークアクセス
_マネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでパブリックに設定されていますが、変更可能です。 _セルフマネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでなしに設定されており、制限があります。ただし、管理者は、DataRobotプラットフォームの設定時にこれを変更できます。 詳細については、DataRobotの担当者または管理者にお問い合わせください。
-
metadata.yaml
ファイルをアップロードした場合は、設定したい各キー値の行の編集アイコン()をクリックして、ランタイムパラメーターを定義します。 -
タグ、指標、トレーニングパラメーター、アーティファクトに、追加の キー値を設定します。
再トレーニングジョブを作成した後、そのジョブを 再トレーニングポリシーとしてデプロイに追加できます。