Skip to content

デプロイの使用状況

テキスト生成VDB、およびMCPのカスタムモデルデプロイでは、使用状況タブは使用状況で説明されている標準的な予測処理ビューに従います。 エージェントワークフロー(およびNIM)のデプロイでは、以下のクォータ監視エクスペリエンスが主要な使用状況ビューになります。

Quota usage monitoring

エージェントワークフローおよびNIMのデプロイにおいて、モニタリング > 使用状況タブのクォータ監視ダッシュボードでは、ユーザーまたはエージェントごとにセグメント化された使用履歴が可視化されます。 その他のサーバーレス生成デプロイでも、クォータの監視が適用される場合は、同じコンソールのコントロールを使用します。

The Quota monitoring dashboard displays three key metric tiles at the top of the page:

指標 説明
リクエストの合計数 The total number of requests made during the selected time range, along with the average requests per minute.
レート制限されたリクエストの総数 The total number of requests that were rate limited during the selected time range, along with the average rate limited requests per minute.
総トークン数 The total number of tokens consumed during the selected time range, along with the average tokens per minute.
平均同時リクエスト数 The average number of simultaneous API calls processed by the agent service over the defined interval, tracked as a key metric for observability and used to enforce the system's quota limit on simultaneous operations.

Each metric displays the value for the selected time frame and the average per minute in green. Click the metric tile to review the corresponding chart below:

  • リクエストの合計数
  • レート制限されたリクエストの総数
  • 総トークン数
  • 平均同時リクエスト数

You can configure the Quota monitoring dashboard to focus the visualized statistics on specific entities and time frames. 次のコントロールを使用できます。

フィルター 説明
モデル Select the model version to monitor. The Current option displays data for the active model version.
範囲 (UTC) Select the date and time range for the data displayed. Use the date pickers to set the start and end times in UTC.
単位 Select the time resolution for aggregating data: Hourly, Daily, or Weekly.
エンティティ Filter by entity type: All, User, or Agent.
表示を更新 Updates the dashboard with the latest data based on the current filter settings.
リセット Resets all filters to their default values.

Quota monitoring charts

The Quota monitoring charts display an area chart showing the distribution of requests over time, rate limited requests over time, or token count over time. This chart is a stacked chart (or stacked graph), a chart stacking multiple data series on top of each other to visualize how each entity contributes to the total over time and across categories. Each chart is segmented by entity (user or agent). Each entity is represented by a different color in the chart legend.

チャートの要素 説明
1 Entity filter Displays all entities (users or agents) included in the selected time range. Each entity is represented by a dot that matches the area in the chart.
2 Entity legend Displays all entities (users or agents) included in the selected time range. Each entity is represented by a dot that matches the area in the chart.
3 Time range (X-axis) Displays the time range selected in the filters, showing the date range from start to end.
4 Metric (Y-axis) Displays the number of requests, rate limited requests, or tokens on the vertical axis.
5 Request areas Overlapping areas show the volume of requests per entity over time. The height of each area at any point represents the number of requests for that entity at that time. This chart is a stacked chart (or stacked graph), a chart stacking multiple data series on top of each other to visualize how each entity contributes to the total over time and across categories.
6 トレース Click Show tracing to view tracing data for the requests.
7 エクスポート Click Export to download a .csv file.

Hover over the chart to view detailed information about the number of requests for each entity at specific time points.

Request tracing table

プレミアム機能

トレースはプレミアム機能です。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。

On any Quota monitoring chart, click Show tracing to view tracing data for the deployment. このトレースチャートは、データ探索タブにあるトレースチャートと同様に機能します。

トレースは、モデルまたはエージェントのワークフローに対するリクエストがたどった経路を表します。 DataRobotでは、トレースにOpenTelemetryフレームワークを使用しています。 トレースは、起点から解決まで、リクエストのエンドツーエンドの経路全体を追跡します。 各トレースには、ルートスパンから始まる1つ以上のスパンが含まれます。 ルートスパンはリクエストの経路全体を表し、プロセスの各ステップの子スパンが含まれます。 ルート(または親)スパンと各子スパンは、同じトレースIDを共有します。

アクセスと保持

トレーステーブルは、すべてのカスタムモデルおよび外部モデルのデプロイで利用できます。 トレースデータは30日間保存され、その後自動的に削除されます。

トレーステーブルでは、各トレースに関連する以下のフィールドを確認できます。

説明
タイムスタンプ YYYY-MM-DD HH:MM形式でのトレースの日時。
ステータス すべてのスパンを含むトレースの全体的なステータス。 依存タスクが失敗した場合、ステータスエラーになります。
トレースID トレースの一意の識別子。
期間 トレースの完了にかかった時間(ミリ秒単位)。 この値は、(四捨五入された)ルートスパンの期間と同じで、子スパンによって表されるすべてのアクションが含まれます。
スパン数 トレースに含まれる完了したスパン(アクション)の数。
コスト コストデータが指定されている場合は、トレースの総コスト。
プロンプト トレースに関連するユーザープロンプト。
補完 トレースのプロンプトに関連付けられているエージェントまたはモデルの回答(補完)。
ツール トレースで表されたリクエスト中に呼び出されるツールまたはツール群。

フィルターをクリックして、最小スパン期間最大スパン期間最小トレースコスト最大トレースコストでフィルターします。 スパンフィルターの単位はナノ秒(ns)です。チャートにはスパンがミリ秒(ms)で表示されます。

フィルターのアクセシビリティ

スパンが詳細ビューに展開されると、 フィルターボタンは非表示になります。 フィルターを適用したチャートビューに戻るには、 詳細パネルを表示しないをクリックします。

トレースに含まれるスパンとトレースの詳細を確認するには、トレーステーブルのトレース行をクリックします。 スパンの色は、スパンサービス(通常はデプロイ)に対応します。 スパンに関連付けられたデプロイまたはサービスへのアクセス権がない場合、制限されたスパンが表示されます。 スパンはチャート形式またはリスト形式で表示できます。

スパンの詳細をコントロール

どちらのビューからでも、 テーブルを表示しないをクリックしてタイムスタンプテーブルを折りたたんだり、 詳細パネルを表示しないをクリックして展開されたトレーステーブルビューに戻ったりすることができます。

トレースの詳細

リストビューでトレースの詳細をクリックすると、現在のスパンに関連付けられているトレースに関する入力/出力プロンプト補完)および評価の詳細を表示できます。

どちらのビューでも、スパンサービス名をクリックして、デプロイまたはリソースにアクセスします(アクセス権がある場合)。 生成AIモデルまたはエージェントワークフローの設定に応じた追加情報を、情報リソースイベント入力/出力エラーログの各タブで入手できます。 エラータブは、トレースでエラーが発生した場合にのみ表示されます。

トレースログをフィルター

リストビューから、スパンのOTelログを表示できます。 表示される結果は完全なデプロイログのサブセットであり、以下のようにアクセスされます。

  1. リストビューを開き、トレースの詳細でスパンを選択します。

  2. ログタブをクリックします。

  3. ログを表示をクリックします。

トレーステーブルのOTel属性

コストプロンプト補完、およびツールについては、DataRobotはトレースに属するすべてのスパンにわたる特定のスパン属性を読み取ります。 その他の列(タイムスタンプ期間など)は、これらの属性ではなく、トレースおよびスパンのメタデータから取得されます。

OpenTelemetryのマッピング
コスト トレース内のスパンにある datarobot.moderation.cost属性の数値を合計します(その属性が存在する場合)。
プロンプト gen_ai.prompt属性を使用します。 複数のスパンにgen_ai.promptが含まれている場合、トレース順で最初に検出された値が表示されます。
補完 gen_ai.completion属性を使用します。 複数のスパンにgen_ai.completionが含まれている場合、トレース順で最後に検出された値が表示されます。
ツール トレース内のスパンで検出されたtool_name属性の一意の値をすべて収集し、それらのツール名を列に一覧表示します。

属性キーは完全に一致する必要があります(gen_ai内のアンダースコアも含みます)。 genai.promptGenAI.promptといった名前は、プロンプトおよび補完列では読み込まれません。

自動計装(DataRobotのエージェントテンプレートを含む)では、多くの場合、gen_ai.promptgen_ai.completion、そして場合によってはtool_nameが設定されます。 カスタムモデルや外部モデルの場合、フレームワークが異なります。ツールが実行されても(たとえば、一部のLangGraphコールバックフロー)、実行時にtool_nameが出力されない場合があります。 その場合、プロンプト補完には値を設定できますが、ツールについては、ツール内で実行されるスパンにtool_nameが設定されるまでは空のままになります。トレースの実装を参照してください。

レート制限されたリクエストテーブル

The Rate limited requests table provides a detailed breakdown of rate limiting by entity:

テーブル要素 説明
1 Entity type filter Filter the table by entity type (user or agent).
2 Rate limited percentage filter Filter entities by their rate limited percentage threshold (zero, low, medium, or high).
3 Search box Search for specific entities by name or identifier.
4 Entity column Displays the entity identifier (user email or agent name).
5 Rate limited requests column Shows the number of rate limited requests and the percentage of total requests that were rate limited. The percentage is highlighted in red when it exceeds a threshold, or displayed in gray when it is 0%.
6 Requests column Displays the number of requests that were rate limited due to exceeding the request quota.
7 Token count column Displays the number of requests that were rate limited due to exceeding the token quota.
8 Concurrent requests column Displays the number of requests that were rate limited due to exceeding the concurrent requests quota.

The table helps identify which entities are experiencing rate limiting and to what extent, allowing you to adjust quotas or usage patterns accordingly.