Skip to content

再トレーニングジョブをの作成

手動またはテンプレートから、コードベースの再トレーニングポリシーを実行するジョブを追加します。 再トレーニングジョブを表示および追加するには、ジョブ > 再トレーニングタブに移動し、以下の操作を行います。

  • 新しい再トレーニングジョブを手動で追加するには、+ 新しい再トレーニングジョブを追加(またはジョブパネルが開いている場合は最小化された追加ボタン )をクリックします。

  • テンプレートから再トレーニングジョブを作成するには、追加ボタンの横にある をクリックし、再トレーニングの下にあるテンプレートから新規作成をクリックします。

新しいジョブがアセンブルタブに開きます。 選択した作成オプションに応じて、以下の表でリンクされている設定手順に進みます。

再トレーニングジョブタイプ 説明
新しい再トレーニングジョブを追加 コードベースの再トレーニングポリシーを実装するジョブを手動で追加します。
テンプレートから新規作成 DataRobotが提供するテンプレートからジョブを追加して、コードベースの再トレーニングポリシーを実装します。

再トレーニングジョブにはメタデータが必要

すべての再トレーニングジョブには、再トレーニングポリシーをデプロイおよび再トレーニングポリシーに関連付けるためのmetadata.yamlファイルが必要です。

新しい再トレーニングジョブを追加

コードベースの再トレーニングのジョブを手動で追加するには:

  1. 新しいジョブのアセンブルタブで、ジョブ名(または編集アイコン)をクリックして新しいジョブ名を入力してから、確認 をクリックします:

  2. 環境セクションで、ジョブの基本環境を選択します。

    利用可能なドロップイン環境はDataRobotのインストール形態によって異なりますが、一般的に利用可能なパブリックドロップイン環境とDRUMリポジトリのテンプレートを以下の表に示します。 DataRobotのインストール形態によっては、これらの環境のPythonバージョンが異なる場合があり、さらに非公開の環境が利用できる場合もあります。

    ドロップイン環境のセキュリティ

    2025年3月にリリースされたマネージドAIプラットフォームから、ほとんどの汎用DataRobotカスタムモデルのドロップイン環境は、セキュリティが強化されたコンテナイメージになりました。 カスタムジョブの実行にセキュリティが強化された環境が必要な場合、POSIX-shell標準に準拠したシェルコードのみがサポートされます。 POSIXシェル標準に準拠したセキュリティ強化環境では、限られたシェルユーティリティのみがサポートされています。

    ドロップイン環境のセキュリティ

    セルフマネージドAIプラットフォームのリリース11.0から、ほとんどの汎用DataRobotカスタムモデルのドロップイン環境は、セキュリティが強化されたコンテナイメージになりました。 カスタムジョブの実行にセキュリティが強化された環境が必要な場合、POSIX-shell標準に準拠したシェルコードのみがサポートされます。 POSIXシェル標準に準拠したセキュリティ強化環境では、限られたシェルユーティリティのみがサポートされています。

    環境名と例 互換性とアーティファクトファイルの拡張子
    Python 3.X Pythonベースのカスタムモデルとジョブ。 モデルファイルにrequirements.txtファイルを含めることで、必要な依存関係をすべてインストールしてください。
    Python 3.X GenAI 生成AIモデル(Text GenerationまたはVector Databaseのターゲットタイプ)
    Python 3.X ONNXドロップイン ONNXモデルとジョブ(.onnx
    Python 3.X PMMLドロップイン PMMLモデルとジョブ(.pmml
    Python 3.X PyTorchドロップイン PyTorchモデルとジョブ(.pth
    Python 3.X Scikit-Learnドロップイン Scikit-Learnモデルとジョブ(.pkl
    Python 3.X XGBoostドロップイン ネイティブXGBoostモデルとジョブ(.pkl
    Python 3.X Kerasドロップイン TensorFlow(.h5)がサポートするKerasモデルとジョブ
    Javaドロップイン DataRobotスコアリングコードモデル(.jar
    ドロップイン環境 CARET(.rds)を使ってトレーニングされたRモデル
    CARETが推奨するすべてのライブラリをインストールするのに時間がかかるため、パッケージ名でもあるモデルタイプのみがインストールされます(例:brnnglmnet)。 この環境のコピーを作成し、Dockerfileを修正して、必要なパッケージを追加でインストールします。 この環境をカスタマイズする際のビルド回数を減らすために、# Install caret modelsセクションで不要な行を削除して、必要なものだけをインストールすることもできます。 CARETドキュメントを参照して、モデルの手法がパッケージ名と一致しているかどうかを確認してください。 このリンクをクリックする前にGitHubにログインしてください。

    scikit-learn

    すべてのPython環境には、(必要に応じて)前処理を支援するscikit-learnが含まれていますが、sklearnモデルで予測を行うことができるのはscikit-learnだけです。

  3. ファイルセクションで、カスタムジョブを構築します。 ボックスにファイルをドラッグするか、このセクションのオプションを使用して、カスタムジョブの構築に必要なファイルを作成またはアップロードします。

    オプション 説明
    ソース/アップロードから選択 既存のカスタムジョブファイル(run.shmetadata.yaml、など)をローカルファイルまたはローカルフォルダーとしてアップロードします。
    作成 空のファイルまたはテンプレートを含んだファイルとして新しいファイルを作成し、カスタムジョブに保存します。
    • run.shを作成:エントリーポイントファイルの基本的で編集可能な例を作成します。
    • metadata.yamlを作成:ランタイムパラメーターファイルの基本的で編集可能な例を作成します。
    • README.mdを作成:基本的で編集可能なREADMEファイルを作成します。
    • job.pyを作成:実行時のパラメーターとデプロイをプリントするための基本的で編集可能なPythonジョブファイルを作成します。
    • サンプルジョブを作成:すべてのテンプレートファイルを結合して、基本的で編集可能なカスタムジョブを作成します。 簡単にランタイムパラメーターを設定し、このサンプルジョブを実行できます。
    • 空白ファイルを作成:空のファイルを作成します。 名称未設定の横にある編集アイコン をクリックしてファイル名と拡張子を入力し、カスタムコンテンツを追加します。 次のステップでは、カスタム名とコンテンツを使用して、このように作成されたファイルをエントリーポイントとして識別できます。 新しいファイルを設定したら、保存をクリックします。

    ファイルの置き換え

    既存のファイルと同じ名前の新しいファイルを追加する場合、保存をクリックすると、ファイルセクションで古いファイルが置き換えられます。

  4. 設定セクションで、ジョブのエントリーポイントシェル(.sh)ファイルを設定します。 run.sh ファイルを追加した場合、そのファイルがエントリーポイントです。それ以外の場合は、ドロップダウンリストからエントリーポイントシェルファイルを選択する必要があります。 エントリーポイントファイルでは、複数のジョブファイルを調整できます。

  5. リソースセクションのセクションヘッダーの横にある 編集をクリックして、以下を設定します。

    プレビュー

    カスタムジョブのリソースバンドルは、デフォルトではオフになっています。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。

    機能フラグ:リソースのバンドルを有効にする

    設定 説明
    リソースバンドル プレビュー機能 カスタムジョブが実行に使用するリソースを設定します。
    ネットワークアクセス カスタムジョブのエグレストラフィックを設定します。 ネットワークアクセスで、以下のいずれかを選択します。
    • パブリック:デフォルト設定。 カスタムジョブは、パブリックネットワーク内の任意の完全修飾ドメイン名(FQDN)にアクセスして、サードパーティのサービスを利用できます。
    • なし:カスタムジョブはパブリックネットワークから隔離され、サードパーティのサービスにアクセスできません。
    デフォルトのネットワークアクセス

    _マネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでパブリックに設定されていますが、変更可能です。 _セルフマネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでなしに設定されており、制限があります。ただし、管理者は、DataRobotプラットフォームの設定時にこれを変更できます。 詳細については、DataRobotの担当者または管理者にお問い合わせください。

  6. (オプション)metadata.yamlファイルをアップロードした場合は、設定したい各キー値の行の編集アイコン をクリックして、ランタイムパラメーターを定義します。

  7. (オプション)タグ指標トレーニングパラメーターアーティファクトに、追加の キー値を設定します。

テンプレートからの再トレーニングジョブの作成

テンプレートから事前に作成された再トレーニングジョブを追加するには:

プレビュー

ジョブテンプレートギャラリーは、デフォルトでオンになっています。

機能フラグ:カスタムジョブのテンプレートギャラリーを有効にする、カスタムテンプレートを有効にする

  1. ギャラリーからカスタムジョブを追加パネルで、ジョブの作成に使用するテンプレートをクリックします。

  2. ジョブの説明、実行環境メタデータ、およびファイルを確認してから、カスタムジョブを作成をクリックします。

    アセンブルタブにジョブが開きます。

  3. 新しいジョブのアセンブルタブで、ジョブ名(または編集アイコン())をクリックして新しいジョブ名を入力してから、確認 をクリックします:

  4. 環境セクションで、テンプレートで設定されたジョブの基本環境を確認します。

  5. ファイルセクションで、テンプレートによってジョブに追加されたファイルを確認します。

    • 編集アイコン をクリックすると、テンプレートによって追加されたファイルを変更できます。

    • 削除アイコン をクリックすると、テンプレートによって追加されたファイルを削除できます。

  6. 新しいファイルを追加する必要がある場合は、このセクションのオプションを使用して、カスタムジョブの構築に必要なファイルを作成またはアップロードします。

    オプション 説明
    アップロード 既存のカスタムジョブファイル(run.shmetadata.yaml、など)をローカルファイルまたはローカルフォルダーとしてアップロードします。
    作成 空のファイルまたはテンプレートを含んだファイルとして新しいファイルを作成し、カスタムジョブに保存します。
    • run.shを作成:エントリーポイントファイルの基本的で編集可能な例を作成します。
    • metadata.yamlを作成:ランタイムパラメーターファイルの基本的で編集可能な例を作成します。
    • README.mdを作成:基本的で編集可能なREADMEファイルを作成します。
    • job.pyを作成:実行時のパラメーターとデプロイをプリントするための基本的で編集可能なPythonジョブファイルを作成します。
    • サンプルジョブを作成:すべてのテンプレートファイルを結合して、基本的で編集可能なカスタムジョブを作成します。 簡単にランタイムパラメーターを設定し、このサンプルジョブを実行できます。
    • 空白ファイルを作成:空のファイルを作成します。 名称未設定の横にある編集アイコン()をクリックしてファイル名と拡張子を入力し、カスタムコンテンツを追加します。 次のステップでは、カスタム名とコンテンツを使用して、このように作成されたファイルをエントリーポイントとして識別できます。 新しいファイルを設定したら、保存をクリックします。

    ファイルの置き換え

    既存のファイルと同じ名前の新しいファイルを追加する場合、保存をクリックすると、ファイルセクションで古いファイルが置き換えられます。

  7. 設定セクションで、テンプレート(通常.sh)によって追加されたジョブのエントリーポイントシェル(run.sh)ファイルを確認します。 エントリーポイントファイルでは、複数のジョブファイルを調整できます。

  8. リソースセクションで、ジョブのデフォルトのリソース設定を確認します。 設定を変更するには、セクションヘッダーの横にある  編集をクリックし、以下のように設定します。

    本機能の提供について

    カスタムジョブのリソースバンドルは、デフォルトではオフになっています。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。

    機能フラグ:リソースのバンドルを有効にする

    設定 説明
    リソースバンドル プレビュー機能 カスタムジョブが実行に使用するリソースを設定します。
    ネットワークアクセス カスタムジョブのエグレストラフィックを設定します。 ネットワークアクセスで、以下のいずれかを選択します。
    • パブリック:デフォルト設定。 カスタムジョブは、パブリックネットワーク内の任意の完全修飾ドメイン名(FQDN)にアクセスして、サードパーティのサービスを利用できます。
    • なし:カスタムジョブはパブリックネットワークから隔離され、サードパーティのサービスにアクセスできません。
    デフォルトのネットワークアクセス

    _マネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでパブリックに設定されていますが、変更可能です。 _セルフマネージドAIプラットフォーム_では、ネットワークアクセスはデフォルトでなしに設定されており、制限があります。ただし、管理者は、DataRobotプラットフォームの設定時にこれを変更できます。 詳細については、DataRobotの担当者または管理者にお問い合わせください。

  9. metadata.yamlファイルをアップロードした場合は、設定したい各キー値の行の編集アイコン()をクリックして、ランタイムパラメーターを定義します。

  10. タグ指標トレーニングパラメーターアーティファクトに、追加の キー値を設定します。

再トレーニングジョブを作成した後、そのジョブを 再トレーニングポリシーとしてデプロイに追加できます。

ランタイムパラメーターの定義

ランタイムパラメーターを作成および定義して、実行時にカスタムジョブで使用されるスクリプトとタスクに異なる値を指定することができます。これをmetadata.yamlファイルに含めることで、カスタムジョブを再利用しやすくなります。 このファイルのテンプレートは、ファイル > 作成ドロップダウンから使用できます。

ランタイムパラメーターを定義するには、以下のruntimeParameterDefinitionsmetadata.yamlに追加できます。

キー 説明
fieldName ランタイムパラメーターの名前を定義します。
type ランタイムパラメーターに含まれるデータ型(stringbooleannumericcredentialdeployment)を定義します。
defaultValue (オプション)ランタイムパラメーターのデフォルト文字列値(credentialタイプはデフォルト値をサポートしません) defaultValueを指定せずにランタイムパラメーターを定義した場合、デフォルト値はNoneです。
minValue (オプション)numericランタイムパラメーターには、ランタイムパラメーターで使用可能な最小数値を設定します。
maxValue (オプション)numericランタイムパラメーターには、ランタイムパラメーターで使用可能な最大数値を設定します。
credentialType (オプション)credentialランタイムパラメーターの場合、パラメーターに含める資格情報のタイプを設定します。
allowEmpty (オプション)ランタイムパラメーターに空のフィールドポリシーを設定します。
  • True:(デフォルト)空のランタイムパラメーターを許可します。
  • False:デプロイ前にランタイムパラメーターの値を指定するよう徹底します。
description (オプション)ランタイムパラメーターの目的または内容の説明を入力します。
例: metadata.yaml
name: runtime-parameter-example

runtimeParameterDefinitions:
- fieldName: my_first_runtime_parameter
  type: string
  description: My first runtime parameter.

- fieldName: runtime_parameter_with_default_value
  type: string
  defaultValue: Default
  description: A string-type runtime parameter with a default value.

- fieldName: runtime_parameter_boolean
  type: boolean
  defaultValue: true
  description: A boolean-type runtime parameter with a default value of true.

- fieldName: runtime_parameter_numeric
  type: numeric
  defaultValue: 0
  minValue: -100
  maxValue: 100
  description: A boolean-type runtime parameter with a default value of 0, a minimum value of -100, and a maximum value of 100.

- fieldName: runtime_parameter_for_credentials
  type: credential
  allowEmpty: false
  description: A runtime parameter containing a dictionary of credentials. 

credentialランタイムパラメータータイプは、DataRobot REST APIで使用可能な任意のcredentialType値をサポートします。 以下の例に示すように、含まれる資格情報はcredentialTypeに依存します。

備考

サポートされている資格情報タイプの詳細については、 資格情報のAPIリファレンスドキュメントを参照してください。

資格情報タイプ
basic
basic:
  credentialType: basic
  description: string
  name: string
  password: string
  user: string
        
azure
azure:
  credentialType: azure
  description: string
  name: string
  azureConnectionString: string
        
gcp
gcp:
  credentialType: gcp
  description: string
  name: string
  gcpKey: string
        
s3
s3:
credentialType: s3
  description: string
  name: string
  awsAccessKeyId: string
  awsSecretAccessKey: string
  awsSessionToken: string
        
api_token
api_token:
  credentialType: api_token
  apiToken: string
  name: string