Skip to content

サービスの正常性

サービスの正常性タブでは、予測リクエストに迅速かつ確実に応答するデプロイの能力に関する指標を追跡します。 これは、ボトルネックを特定し、適切なプロビジョニングに不可欠なキャパシティを評価するのに役立ちます。 たとえば、全般的にモデルのレスポンス時間が遅く感じられる場合、モデルのデプロイのサービスの正常性タブが役に立ちます。 このタブで予測リクエストの増加に応じてレイテンシーの中央値が上昇することが確認できる場合があります。 新しいモデルに切り替えたときレイテンシーが増える場合、パフォーマンスが優れている別のモデルで新しいモデルを置き換えることが可能かどうかを検討できます。

サービスの正常性にアクセスするには、デプロイインベントリぺージから1つのデプロイを選択して、次に表示される概要ページでサービス正常性タブを選択します。 The tab provides informational tiles and a chart to help assess the activity level and health of the deployment.

予測の時間

予測の時間の値は、データドリフトタブと精度タブ、およびサービスの正常性タブで異なります。

  • [サービスの正常性]タブの「予測リクエストの日時」は、常に予測サーバーが予測リクエストを受信した日時です。 この予測リクエストの追跡方法は、診断目的で予測サービスの正常性を正確に示しています。

  • データドリフトタブと精度タブについてデフォルトで、「予測リクエストの時間」は、予測リクエストを送信した時刻になります。これは、 予測履歴とサービスの正常性設定で、予測タイムスタンプでオーバーライドできます。

指標タイルとチャートの理解

DataRobotには、モデルおよび時間枠の現在の設定に基づいて情報統計が表示されます。 したがって、タイル値は、スライダーで選択された単位に対応します。 スライダーの間隔値が週の場合、表示されるタイル指標は週に対応します。 指標タイルをクリックすると、下のチャートが更新されます。

サービスの正常性タブでは、ダッッシュボード上で以下の指標をレポートします。

外部モデルと監視ジョブのサービス正常性に関する情報

サービス正常性の情報は、エージェントによって監視される外部のデプロイでは入手できません。また、予測監視ジョブを介して予測がアップロードされるデプロイでも入手できません。

統計 選択した時間枠のレポート...
予測の合計数 デプロイで行われた予測の回数(予測ノードごと)。
リクエストの合計数 デプロイが受信した予測リクエストの数(単一のリクエストに複数の予測リクエストが含まれる場合があります)。
xミリ秒以上のリクエスト
レスポンス時間
実行時間
負荷(コール数/分)の中央値 / 最高値 1分あたりの要求数の中央値と最大値。
データエラーの割合
システムエラーの割合
コンシューマー数 このデプロイに対して予測リクエストを行った個々のユーザー(APIキーによって識別)の数。
キャッシュヒット率

ダッシュボードを設定して、特定のセグメントと時間枠に視覚化された統計をフォーカスできます。 次のコントロールを使用できます。

コントロール 説明
モデル ドロップダウンで選択したモデルを反映するようにダッシュボード表示を更新します。
範囲 (UTC)
単位
セグメント属性 ダッシュボードのフィルター条件となるセグメントを設定します。
セグメント値 ダッシュボードのフィルター条件となるセグメント内で特定の値を設定します。
表示を更新
リセット ダッシュボードコントロールをデフォルト設定に戻します。

指標タイルの下のチャートには、時間経過に伴う個々の指標が表示されるので、サービス品質のパターンを特定するのに役立ちます。 指標タイルをクリックすると、その情報を表すチャートが更新されます。データ範囲スライダーを調整すると、特定の期間に着目できます。

チャートのエクスポート

をクリックします 現在選択されているチャートの.csvまたは.pngファイル、あるいは両方(および.jsonファイル)の.zipアーカイブファイルをエクスポートしてダウンロードします。

| 中央値/ | ピーク負荷(コール/分)チャートには、時間とともにピーク負荷と中央値負荷の2つのラインが表示されます: |