管理エージェント¶
MLOps管理エージェントは、あらゆるタイプのインフラストラクチャのモデルデプロイを自動化するための標準メカニズムを提供します。 自動デプロイと自動モニタリングを組み合わせることで、特にチャレンジャーモデルや再トレーニングなどの重要なMLOps機能で、本番環境のリモートモデルにかかる負担を軽減することができます。 DataRobotアプリケーションからアクセスされるエージェントには、カスタム設定をサポートするサンプルプラグインが付属しています。
管理エージェントの設定¶
管理エージェントを設定するには、以下に詳述する各種コンポーネントを準備する必要があります。
- 予測環境を登録。
- エージェントtarballをダウンロードします。
- 環境プラグインの設定。
- 管理エージェントを設定します。
- デプロイの作成。
予測環境を登録¶
管理エージェントを使用すると、外部予測環境でのモデルのデプロイ、置換、および監視を自動化できます。 管理エージェント設定は、デプロイで使用する予測環境の設定から始めます。 続行する前に、予測環境をDataRobotで登録します。
登録されたら、デプロイ > 予測環境に移動します。 リストから使用する予測環境を選択し、管理エージェントを使用するトグルボタンをオンにします。
オンにしたら、管理エージェントサービスのアカウントホルダーの電子メールアドレスを指定する必要があります。 DataRobotは、アカウントホルダーとして管理サービスアカウントを使用することをお勧めします(設定された予測環境を使用するデプロイに対するアクセス権を持つアカウント)。
エージェントをダウンロード¶
管理エージェントにアクセスするには、MLOpsエージェントtarballをダウンロードして、予測を行うモデルをホストしているリモート環境にインストールします。 ユーザーアイコンをクリックし、開発者ツールに移動することで、DataRobotアプリケーションから直接ダウンロードすることができます。 外部監視エージェントヘッダーの下で、ダウンロードアイコンをクリックします。 完了すると、tarballがブラウザーのダウンロードバーに表示されます。
環境プラグインの設定¶
管理エージェントはデプロイイベント(モデル交換、デプロイの起動など)を、そのイベントに対応して実行する環境プラグインのプロセスに変換します。 tarballには、設定可能なサンプル環境プラグインが含まれています。 これらのプラグインは、リモートモデルで使用されるさまざまなタイプのインフラストラクチャにそのまま対応できますが、特定の環境を完全にサポートするには、これらのプラグインを変更する必要がある場合があります。 最初に、インフラを最も適切にサポートするプラグインを選択し、設定します。場合によっては変更することもできます。 上級ユーザーであれば、完全にカスタマイズした新しいプラグインを作成することも、提供されているプラグインを出発点としてプラグインを作成することもできます。
備考
提供されている管理エージェントプラグインは一例です。 すべてのユースケースで機能することを意図したものではありませんが、ニーズに合わせて変更できます。
MLOps管理エージェントには、次のサンプルプラグインが含まれています。
- Dockerプラグイン。
- ファイルシステム用プラグイン。
- Kubernetesプラグイン。
- テスト用プラグイン。
ヒント
tarballには、プラグインのインストールと設定に役立つREADMEファイルが含まれています。
詳細については、 管理エージェント環境プラグインの設定を参照してください。
エージェントを設定¶
tarballをダウンロードしてエージェントプラグインを設定した後、エージェントの設定ファイルを編集します。
- 管理エージェントがDataRobotに対して認証できるように、DataRobotサービスURLとAPIキーを提供します。
- 管理エージェントが予測環境と関連するデプロイにアクセスできるように、予測環境IDを指定します。
- 使用する管理エージェントプラグインを示します。
詳細については、 管理エージェントのインストールと設定を参照してください。
デプロイの作成¶
予測環境と使用する管理エージェントを設定した後、エージェントが監視するイベントを持つ外部デプロイを作成することができます。 エージェントの監視機能をサポートするためには、上記の手順で設定した予測環境をデプロイで使用する必要があります。 そのためには、DataRobotは、 外部モデルパッケージの登録、およびモデルレジストリから デプロイすることを推奨しています。
デプロイされると、管理エージェントでデプロイが完全に設定され、デプロイイベントを監視し、そのイベントに対応してアクションを自動化できます。