管理エージェントデプロイのステータスとイベント¶
管理エージェントデプロイのステータスと正常性を監視するために、全体的なデプロイステータスと特定のデプロイサービスの正常性イベントを確認できます。
デプロイステータス¶
管理エージェントが管理している外部デプロイでアクションが実行されている場合、デプロイ名の下にバッジが表示されます。 デプロイインベントリ、およびデプロイ内の任意のタブで、デプロイのステータスを表示します。 管理エージェントが管理するデプロイでアクションが実行されている場合、次の4つのデプロイステータスの値が想定されます。
ステータス | バッジ |
---|---|
起動中 | |
停止しています | |
モデルを置換中 | |
エラー発生 |
デプロイイベント¶
管理エージェントは、APIを介してデプロイの正常性とステータスに関する定期的な更新を送信します。 これらは、MLOpsイベントとして報告され、サービスの正常性ページに表示されます。
DataRobotでは、管理エージェントが設定されたら、外部デプロイのデプロイイベントを監視し、操作することができます。 1つの場所から、以下の操作を実行できます。
アクション | ユースケースの例 |
---|---|
デプロイ関連のイベントを記録し、維持する | デプロイアクション、正常性の変更、状態の変更などを記録します。 |
すべての関連イベントを表示する | デプロイイベントの監査。 |
イベントをフィルターして検索する | すべてのモデル変更を表示します。 |
データを抽出する | レポートとオフライン保存。 |
特定のインシデントの通知を受け取る | 障害発生時にSlackのメッセージを受信します。 |
リテンションポリシーを強制する | ログ保持ポリシーに従っていることを確認します(90日間の保持が保証されます。古いイベントは削除される場合があります)。 |
デプロイイベントの概要を表示するには、インベントリからデプロイを選択し、サービスの正常性タブに移動します。 すべてのイベントは、最近のアクティビティ > エージェントのアクティビティセクションに記録されます。
最新のイベントはリストの一番上に表示されます。 各イベントには、発生した日時、説明、およびステータスを示すアイコンが表示されます。
アイコン | 説明 |
---|---|
Green / Passing | 必要なアクションはありません。 |
Yellow / At risk | 懸念がありますが、早急のアクションは必要ありません。監視を継続してください。 |
Red / Failing | 早急なアクションが必要です。 |
Gray / Unknown | 不明 |
Informational | デプロイアクションの詳細を示します(デプロイが開始された、など)。 |
備考
管理エージェントから最後に報告されたサービスの正常性ステータスが優先されることに注意してください。 たとえば、データドリフトが緑でデプロイに成功したにもかかわらず、管理エージェントが不良ステータス (赤で失敗) を送信した場合は、その状態を反映するようにリストが更新されます。
イベント行を選択すると、右サイドパネルに詳細が表示されます。