Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

再トレーニングジョブをの作成

手動またはテンプレートから、コードベースの再トレーニングポリシーを実行するジョブを追加します。 再トレーニングジョブを表示および追加するには、ジョブ > 再トレーニングタブに移動し、以下の操作を行います。

  • 新しい再トレーニングジョブを手動で追加するには、+ 新しい再トレーニングジョブを追加(またはジョブパネルが開いている場合は最小化された追加ボタン )をクリックします。

  • テンプレートから再トレーニングジョブを作成するには、追加ボタンの横にある をクリックし、再トレーニングの下にあるテンプレートから新規作成をクリックします。

新しいジョブがアセンブルタブに開きます。 選択した作成オプションに応じて、以下の表でリンクされている設定手順に進みます。

再トレーニングジョブタイプ 説明
新しい再トレーニングジョブを追加 コードベースの再トレーニングポリシーを実装するジョブを手動で追加します。
テンプレートから新規作成 DataRobotが提供するテンプレートからジョブを追加して、コードベースの再トレーニングポリシーを実装します。

再トレーニングジョブにはメタデータが必要

すべての再トレーニングジョブには、再トレーニングポリシーをデプロイおよび再トレーニングポリシーに関連付けるためのmetadata.yamlファイルが必要です。

新しい再トレーニングジョブを追加

コードベースの再トレーニングのジョブを手動で追加するには:

  1. 新しいジョブのアセンブルタブで、ジョブ名(または編集アイコン)をクリックして新しいジョブ名を入力してから、確認 をクリックします:

  2. 環境セクションで、ジョブの基本環境を選択します。

    The available drop-in environments depend on your DataRobot installation; however, the table below lists commonly available public drop-in environments with templates in the DRUM repository. Depending on your DataRobot installation, the Python version of these environments may vary, and additional non-public environments may be available for use.

    Drop-in environment security

    Starting with the March 2025 Managed AI Platform release, most general purpose DataRobot custom model drop-in environments are security-hardened container images. When you require a security-hardened environment for running custom jobs, only shell code following the POSIX-shell standard is supported. Security-hardened environments following the POSIX-shell standard support a limited set of shell utilities.

    Drop-in environment security

    Starting with the 11.0 Self-Managed AI Platform release, most general purpose DataRobot custom model drop-in environments are security-hardened container images. When you require a security-hardened environment for running custom jobs, only shell code following the POSIX-shell standard is supported. Security-hardened environments following the POSIX-shell standard support a limited set of shell utilities.

    環境名と例 Compatibility & artifact file extension
    Python 3.X Python-based custom models and jobs. You are responsible for installing all required dependencies through the inclusion of a requirements.txt file in your model files.
    Python 3.X GenAI 生成AIモデル(Text GenerationまたはVector Databaseのターゲットタイプ)
    Python 3.X ONNX Drop-In ONNX models and jobs (.onnx)
    Python 3.X PMML Drop-In PMML models and jobs (.pmml)
    Python 3.X PyTorch Drop-In PyTorch models and jobs (.pth)
    Python 3.X Scikit-Learn Drop-In Scikit-Learn models and jobs (.pkl)
    Python 3.X XGBoost Drop-In Native XGBoost models and jobs (.pkl)
    Python 3.X Keras Drop-In Keras models and jobs backed by tensorflow (.h5)
    Javaドロップイン DataRobotスコアリングコードモデル(.jar
    ドロップイン環境 CARET(.rds)を使ってトレーニングされたRモデル
    CARETが推奨するすべてのライブラリをインストールするのに時間がかかるため、パッケージ名でもあるモデルタイプのみがインストールされます(例:brnnglmnet)。 この環境のコピーを作成し、Dockerfileを修正して、必要なパッケージを追加でインストールします。 この環境をカスタマイズする際のビルド回数を減らすために、# Install caret modelsセクションで不要な行を削除して、必要なものだけをインストールすることもできます。 CARETドキュメントを参照して、モデルの手法がパッケージ名と一致しているかどうかを確認してください。 このリンクをクリックする前にGitHubにログインしてください。

    scikit-learn

    All Python environments contain scikit-learn to help with preprocessing (if necessary), but only scikit-learn can make predictions on sklearn models.

  3. ファイルセクションで、カスタムジョブを構築します。 ボックスにファイルをドラッグするか、このセクションのオプションを使用して、カスタムジョブの構築に必要なファイルを作成またはアップロードします。

    オプション 説明
    ソース/アップロードから選択 既存のカスタムジョブファイル(run.shmetadata.yaml、など)をローカルファイルまたはローカルフォルダーとしてアップロードします。
    作成 空のファイルまたはテンプレートを含んだファイルとして新しいファイルを作成し、カスタムジョブに保存します。
    • run.shを作成:エントリーポイントファイルの基本的で編集可能な例を作成します。
    • metadata.yamlを作成:ランタイムパラメーターファイルの基本的で編集可能な例を作成します。
    • README.mdを作成:基本的で編集可能なREADMEファイルを作成します。
    • job.pyを作成:実行時のパラメーターとデプロイをプリントするための基本的で編集可能なPythonジョブファイルを作成します。
    • サンプルジョブを作成:すべてのテンプレートファイルを結合して、基本的で編集可能なカスタムジョブを作成します。 簡単にランタイムパラメーターを設定し、このサンプルジョブを実行できます。
    • 空白ファイルを作成:空のファイルを作成します。 名称未設定の横にある編集アイコン をクリックしてファイル名と拡張子を入力し、カスタムコンテンツを追加します。 次のステップでは、カスタム名とコンテンツを使用して、このように作成されたファイルをエントリーポイントとして識別できます。 新しいファイルを設定したら、保存をクリックします。

    ファイルの置き換え

    既存のファイルと同じ名前の新しいファイルを追加する場合、保存をクリックすると、ファイルセクションで古いファイルが置き換えられます。

  4. 設定セクションで、ジョブのエントリーポイントシェル(.sh)ファイルを設定します。 run.sh ファイルを追加した場合、そのファイルがエントリーポイントです。それ以外の場合は、ドロップダウンリストからエントリーポイントシェルファイルを選択する必要があります。 エントリーポイントファイルでは、複数のジョブファイルを調整できます。

  5. リソースセクションのセクションヘッダーの横にある 編集をクリックして、以下を設定します。

    プレビュー

    カスタムジョブのリソースバンドルは、デフォルトではオフになっています。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。

    機能フラグ:リソースのバンドルを有効にする

    設定 説明
    リソースバンドル プレビュー機能 カスタムジョブが実行に使用するリソースを設定します。
    ネットワークアクセス カスタムジョブのエグレストラフィックを設定します。 ネットワークアクセスで、以下のいずれかを選択します。
    • パブリック:デフォルト設定。 カスタムジョブは、パブリックネットワーク内の任意の完全修飾ドメイン名(FQDN)にアクセスして、サードパーティのサービスを利用できます。
    • なし:カスタムジョブはパブリックネットワークから隔離され、サードパーティのサービスにアクセスできません。
    デフォルトのネットワークアクセス

    _マネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでパブリックに設定されていますが、変更可能です。 _セルフマネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでなしに設定されており、制限があります。ただし、管理者は、DataRobotプラットフォームの設定時にこれを変更できます。 詳細については、DataRobotの担当者または管理者にお問い合わせください。

  6. (オプション)metadata.yamlファイルをアップロードした場合は、設定したい各キー値の行の編集アイコン をクリックして、ランタイムパラメーターを定義します。

  7. (オプション)タグ指標トレーニングパラメーターアーティファクトに、追加の キー値を設定します。

テンプレートからの再トレーニングジョブの作成

テンプレートから事前に作成された再トレーニングジョブを追加するには:

プレビュー

ジョブテンプレートギャラリーは、デフォルトでオンになっています。

機能フラグ:カスタムジョブのテンプレートギャラリーを有効にする、カスタムテンプレートを有効にする

  1. ギャラリーからカスタムジョブを追加パネルで、ジョブの作成に使用するテンプレートをクリックします。

  2. ジョブの説明、実行環境メタデータ、およびファイルを確認してから、カスタムジョブを作成をクリックします。

    アセンブルタブにジョブが開きます。

  3. 新しいジョブのアセンブルタブで、ジョブ名(または編集アイコン())をクリックして新しいジョブ名を入力してから、確認 をクリックします:

  4. 環境セクションで、テンプレートで設定されたジョブの基本環境を確認します。

  5. ファイルセクションで、テンプレートによってジョブに追加されたファイルを確認します。

    • 編集アイコン をクリックすると、テンプレートによって追加されたファイルを変更できます。

    • 削除アイコン をクリックすると、テンプレートによって追加されたファイルを削除できます。

  6. 新しいファイルを追加する必要がある場合は、このセクションのオプションを使用して、カスタムジョブの構築に必要なファイルを作成またはアップロードします。

    オプション 説明
    アップロード 既存のカスタムジョブファイル(run.shmetadata.yaml、など)をローカルファイルまたはローカルフォルダーとしてアップロードします。
    作成 空のファイルまたはテンプレートを含んだファイルとして新しいファイルを作成し、カスタムジョブに保存します。
    • run.shを作成:エントリーポイントファイルの基本的で編集可能な例を作成します。
    • metadata.yamlを作成:ランタイムパラメーターファイルの基本的で編集可能な例を作成します。
    • README.mdを作成:基本的で編集可能なREADMEファイルを作成します。
    • job.pyを作成:実行時のパラメーターとデプロイをプリントするための基本的で編集可能なPythonジョブファイルを作成します。
    • サンプルジョブを作成:すべてのテンプレートファイルを結合して、基本的で編集可能なカスタムジョブを作成します。 簡単にランタイムパラメーターを設定し、このサンプルジョブを実行できます。
    • 空白ファイルを作成:空のファイルを作成します。 名称未設定の横にある編集アイコン()をクリックしてファイル名と拡張子を入力し、カスタムコンテンツを追加します。 次のステップでは、カスタム名とコンテンツを使用して、このように作成されたファイルをエントリーポイントとして識別できます。 新しいファイルを設定したら、保存をクリックします。

    ファイルの置き換え

    既存のファイルと同じ名前の新しいファイルを追加する場合、保存をクリックすると、ファイルセクションで古いファイルが置き換えられます。

  7. 設定セクションで、テンプレート(通常.sh)によって追加されたジョブのエントリーポイントシェル(run.sh)ファイルを確認します。 エントリーポイントファイルでは、複数のジョブファイルを調整できます。

  8. リソースセクションで、ジョブのデフォルトのリソース設定を確認します。 設定を変更するには、セクションヘッダーの横にある  編集をクリックし、以下のように設定します。

    本機能の提供について

    カスタムジョブのリソースバンドルは、デフォルトではオフになっています。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。

    機能フラグ:リソースのバンドルを有効にする

    設定 説明
    リソースバンドル プレビュー機能 カスタムジョブが実行に使用するリソースを設定します。
    ネットワークアクセス カスタムジョブのエグレストラフィックを設定します。 ネットワークアクセスで、以下のいずれかを選択します。
    • パブリック:デフォルト設定。 カスタムジョブは、パブリックネットワーク内の任意の完全修飾ドメイン名(FQDN)にアクセスして、サードパーティのサービスを利用できます。
    • なし:カスタムジョブはパブリックネットワークから隔離され、サードパーティのサービスにアクセスできません。
    デフォルトのネットワークアクセス

    _マネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでパブリックに設定されていますが、変更可能です。 _セルフマネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでなしに設定されており、制限があります。ただし、管理者は、DataRobotプラットフォームの設定時にこれを変更できます。 詳細については、DataRobotの担当者または管理者にお問い合わせください。

  9. metadata.yamlファイルをアップロードした場合は、設定したい各キー値の行の編集アイコン()をクリックして、ランタイムパラメーターを定義します。

  10. タグ指標トレーニングパラメーターアーティファクトに、追加の キー値を設定します。

再トレーニングジョブを作成した後、そのジョブを 再トレーニングポリシーとしてデプロイに追加できます。


更新しました 2025年4月2日