再トレーニングの設定¶
DataRobotは、大規模な手作業を行うことなくデプロイ後のモデルのパフォーマンスを維持するために、デプロイに対して自動再トレーニング機能を提供しています。 AIカタログに登録された再トレーニングデータセットを指定すると、1つのデプロイに対して最大5つの再トレーニングポリシーを定義できます。 再トレーニングポリシーを定義する前に、再トレーニング > 設定タブでデプロイの全般的な再トレーニング設定を行う必要があります。
備考
再トレーニング設定を編集するには、デプロイのオーナー
権限が必要です。 ユーザー権限を持っている場合は、デプロイの再トレーニング設定を表示できます。
デプロイの再トレーニングの設定ページでは、次の設定を行うことができます。
要素 | 説明 |
---|---|
再トレーニングユーザー | デプロイへのアクセス権を持つオーナーである再トレーニングユーザーを選択します。 リソースを監視するには、再トレーニングポリシーをユーザーアカウントとして実行する必要があります。 |
予測環境 | チャレンジャーモデルをスコアリングするためのデフォルトの予測環境を選択します。 |
再トレーニングデータ | すべての再トレーニングプロファイルに対して、再トレーニングデータセットを定義します。 ローカルファイルをドラッグまたはブラウズするか、AIカタログからデータセットを選択します。 |
保存をクリックしてこれらの設定を定義したら、再トレーニングポリシーの定義ができます。
再トレーニングユーザーの選択¶
スケジュールされた再トレーニングポリシーが実行されると、指定されたユーザーの権限とリソースが使用されます(手動でトリガーされたポリシーでは、トリガーしたユーザーのリソースが使用されます。) ユーザーには以下が必要です。
- 再トレーニングデータについて、データを使用し、スナップショットを作成する権限。
- デプロイのためのオーナー権限。
再トレーニングポリシーにより要求されるモデルのトレーニングには、モデリングワーカーが必要です。 ワーカーは再トレーニングユーザーのプールから抽出され、それぞれの再トレーニングポリシーは、再トレーニングユーザーの総ワーカー数の50%を要求します。 たとえば、ユーザーの最大モデリングワーカー数が4の場合、再トレーニングポリシーAがトリガーすると、ワーカー数は2で実行されます。 再トレーニングポリシーBがトリガーすると、こちらもワーカー数が2で実行されます。 仮に、ポリシーAとBが実行中に、ポリシーCがトリガーすると、実行中である2つのポリシーとワーカーを共有します。
備考
ユーザーからのインタラクティブなモデリング要求は、再トレーニングの実行よりも優先されません。 ユーザーのワーカーが再トレーニングに適用されていて、そのユーザーが新規のモデリング実行(手動またはオートパイロット)を開始すると、ワーカーは再トレーニングの実行と共有されます。 このため、DataRobotでは、ワーカー数を制限したユーザーを作成し、このユーザーを再トレーニングジョブに指名することを推奨します。
予測環境を選択¶
チャレンジャー分析では、最初にチャンピオンモデルで行った予測を、チャレンジャーモデルで再生する必要があります。 DataRobotでは、定義されたスケジュールと予測環境を使って、予測の再生を行います。 再トレーニングの結果、新しいチャレンジャーが追加されると、そのチャレンジャーは割り当てられた予測環境を使って、再生されたリクエストから予測を生成します。 チャレンジャーが使用している予測環境は、後でチャレンジャータブから変更できます。
モデルがチャレンジャーとして動作している間は、DataRobotの予測環境にしかデプロイできません。 ただし、チャンピオンモデルはチャレンジャーとは異なる予測環境(DataRobot環境(たとえば、リソースの競合を避けるために「本番」使用と記された環境)またはリモート環境(AWS、OpenShift、GCPなど)のいずれか)を使用することができます。 モデルがチャレンジャーからチャンピオンに昇格する場合は、前のチャンピオンの予測環境を使用する可能性があります。
再トレーニングデータの提供¶
デプロイ上のすべての再トレーニングポリシーが、同じAIカタログのデータセットを参照します。 再トレーニングポリシーがトリガーされると、DataRobotは、最新バージョンのデータセットを使用するか(アップロードされたAIカタログアイテムの場合)、元になるデータソースから新しいスナップショットを作成して使用します (データ接続またはURLを使用するカタログアイテムの場合) 。 たとえば、カタログアイテムがSpark SQLクエリーを使用する場合、再トレーニングポリシーがトリガーされると、そのクエリーが実行され、結果として得られた行はモデリング設定(パーティショニングを含む)への入力として使用されます。 元になるデータが接続されたAIカタログアイテムが、すでに最大数(100)のスナップショットを持っている場合、再トレーニングポリシーは、新しいスナップショットを取る前に最も古いスナップショットを削除します。