Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

Add training data to a custom model

To enable feature drift tracking for a model deployment, you must add training data. To do this, assign training data to a model version.

廃止の通知

Currently, you assign training data directly to a custom model, meaning every version of that model uses the same data; however, this assignment method is deprecated and scheduled for removal. It remains the default method during the deprecation period, even for newly created models, to support backward compatibility.

  1. In Model Registry > Custom Model Workshop, in the Models list, select the model you want to add training data to.

  2. To assign training data to a custom model's versions, you must convert the model. On the Assemble tab, locate the Training data for model versions alert and click Permanently convert:

    注意

    Converting a model's training data assignment method is a one-way action. It cannot be reverted. After conversion, you can't assign training data at the model level. This change applies to the UI and the API. If your organization has any automation depending on "per model" training data assignment, before you convert a model, you should update any related automation to support the new workflow. As an alternative, you can create a new custom model to convert to the "per version" training data assignment method and maintain the deprecated "per model" method on the model required for the automation; however, you should update your automation before the deprecation process is complete to avoid gaps in functionality.

    If the model was already assigned training data, after you convert the model, the Datasets section contains information about the existing training dataset.

  3. On the Assemble tab, next to Datasets:

    • If the model version doesn't have training data assigned, click Assign:

    • If the model version does have training data assigned, click the edit icon (), and, in the Change Training Data dialog box, click the delete icon () to remove the existing training data.

  4. In the Add Training Data (or Change Training Data) dialog box, click and drag a training dataset file into the Training Data box, or click Choose file and do either of the following:

    • Click Local file, select a file from your local storage, and then click Open.

    • Click AI Catalog, select a training dataset you previously uploaded to DataRobot, and click Use this dataset.

  5. オプションSpecify the column name containing partitioning info for your data (based on training/validation/holdout partitioning). If you plan to deploy the custom model and monitor its data drift and accuracy, specify the holdout partition in the column to establish an accuracy baseline.

    重要

    You can track data drift and accuracy without specifying a partition column; however, in that scenario, DataRobot won't have baseline values. The selected partition column should only include the values T, V, or H.

  6. アップロードが完了したら、トレーニングデータを追加をクリックします。

カスタム推論モデルにトレーニングデータを追加する場合(モデルをデプロイできるようにする場合)は、カスタムモデルを選択し、モデル情報タブに移動します。

モデル情報タブには、カスタム推論モデルの属性が一覧表示されます。 トレーニングデータを追加をクリックします。

トレーニングデータをアップロードするよう求めるポップアップが表示されます。

ファイルを選択をクリックし、トレーニングデータをアップロードします。 オプションで、(トレーニング/検定/保留分割に基づき)データの分割情報を含む列名を指定できます。 カスタムモデルをデプロイして精度を監視する場合、列にホールドアウトパーティションを指定して、精度のベースラインを規定します。 パーティション列を指定しなくても精度は追跡できますが、精度のベースラインはありません。 アップロードが完了したら、トレーニングデータを追加をクリックします。

備考

非構造化カスタム推論モデルのトレーニングデータセットとホールドアウトデータセットを指定する方法では、トレーニングデータセットとホールドアウトデータセットを個別にアップロードする必要があります。 さらに、これらのデータセットにはパーティション列を含めることはできません。

注意” ”ファイルサイズに関する注意

カスタムモデルにトレーニングデータを追加する場合、トレーニングデータはRAMとCPUリソースを節約するために フローズン実行の対象となり、トレーニングデータセットのファイルサイズを1.5 GBに制限できます。


更新しました April 19, 2023
Back to top