Deployment usage¶
For text generation, VDB, and MCP custom model deployments, the Usage tab follows the standard prediction-processing views described in Usage. For agentic workflow (and NIM) deployments, the Quota monitoring experience below is the primary usage view.
Quota usage monitoring¶
On the Monitoring > Usage tab for agentic workflow and NIM deployments, the Quota monitoring dashboard visualizes historical usage segmented by user or agent. Other serverless generative deployments use the same Console controls when quota monitoring applies.
The Quota monitoring dashboard displays three key metric tiles at the top of the page:
| 指標 | 説明 |
|---|---|
| リクエストの合計数 | The total number of requests made during the selected time range, along with the average requests per minute. |
| レート制限されたリクエストの総数 | The total number of requests that were rate limited during the selected time range, along with the average rate limited requests per minute. |
| 総トークン数 | The total number of tokens consumed during the selected time range, along with the average tokens per minute. |
| 平均同時リクエスト数 | The average number of simultaneous API calls processed by the agent service over the defined interval, tracked as a key metric for observability and used to enforce the system's quota limit on simultaneous operations. |
Each metric displays the value for the selected time frame and the average per minute in green. Click the metric tile to review the corresponding chart below:
- リクエストの合計数
- レート制限されたリクエストの総数
- 総トークン数
- 平均同時リクエスト数
You can configure the Quota monitoring dashboard to focus the visualized statistics on specific entities and time frames. 次のコントロールを使用できます。
| フィルター | 説明 |
|---|---|
| モデル | Select the model version to monitor. The Current option displays data for the active model version. |
| 範囲 (UTC) | Select the date and time range for the data displayed. Use the date pickers to set the start and end times in UTC. |
| 単位 | Select the time resolution for aggregating data: Hourly, Daily, or Weekly. |
| エンティティ | Filter by entity type: All, User, or Agent. |
| 表示を更新 | Updates the dashboard with the latest data based on the current filter settings. |
| リセット | Resets all filters to their default values. |
Quota monitoring charts¶
The Quota monitoring charts display an area chart showing the distribution of requests over time, rate limited requests over time, or token count over time. This chart is a stacked chart (or stacked graph), a chart stacking multiple data series on top of each other to visualize how each entity contributes to the total over time and across categories. Each chart is segmented by entity (user or agent). Each entity is represented by a different color in the chart legend.
| チャートの要素 | 説明 | |
|---|---|---|
| 1 | Entity filter | Displays all entities (users or agents) included in the selected time range. Each entity is represented by a dot that matches the area in the chart. |
| 2 | Entity legend | Displays all entities (users or agents) included in the selected time range. Each entity is represented by a dot that matches the area in the chart. |
| 3 | Time range (X-axis) | Displays the time range selected in the filters, showing the date range from start to end. |
| 4 | Metric (Y-axis) | Displays the number of requests, rate limited requests, or tokens on the vertical axis. |
| 5 | Request areas | Overlapping areas show the volume of requests per entity over time. The height of each area at any point represents the number of requests for that entity at that time. This chart is a stacked chart (or stacked graph), a chart stacking multiple data series on top of each other to visualize how each entity contributes to the total over time and across categories. |
| 6 | トレース | Click Show tracing to view tracing data for the requests. |
| 7 | エクスポート | Click Export to download a .csv file. |
Hover over the chart to view detailed information about the number of requests for each entity at specific time points.
Request tracing table¶
プレミアム機能
トレースはプレミアム機能です。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。
On any Quota monitoring chart, click Show tracing to view tracing data for the deployment. This tracing chart functions similarly to the tracing chart on the Data Exploration tab.
トレースは、モデルまたはエージェントのワークフローに対するリクエストがたどった経路を表します。 DataRobotでは、トレースにOpenTelemetryフレームワークを使用しています。 トレースは、起点から解決まで、リクエストのエンドツーエンドの経路全体を追跡します。 各トレースには、ルートスパンから始まる1つ以上のスパンが含まれます。 ルートスパンはリクエストの経路全体を表し、プロセスの各ステップの子スパンが含まれます。 ルート(または親)スパンと各子スパンは、同じトレースIDを共有します。
アクセスと保持
The tracing table is available for all custom and external model deployments. Tracing data is stored for a retention period of 30 days, after which it is automatically deleted.
トレーステーブルでは、各トレースに関連する以下のフィールドを確認できます。
| 列 | 説明 |
|---|---|
| タイムスタンプ | YYYY-MM-DD HH:MM形式でのトレースの日時。 |
| ステータス | すべてのスパンを含むトレースの全体的なステータス。 依存タスクが失敗した場合、ステータスはエラーになります。 |
| トレースID | トレースの一意の識別子。 |
| 期間 | トレースの完了にかかった時間(ミリ秒単位)。 この値は、(四捨五入された)ルートスパンの期間と同じで、子スパンによって表されるすべてのアクションが含まれます。 |
| スパン数 | トレースに含まれる完了したスパン(アクション)の数。 |
| コスト | コストデータが指定されている場合は、トレースの総コスト。 |
| プロンプト | トレースに関連するユーザープロンプト。 |
| 補完 | トレースのプロンプトに関連付けられているエージェントまたはモデルの回答(補完)。 |
| ツール | トレースで表されたリクエスト中に呼び出されるツールまたはツール群。 |
フィルターをクリックして、最小スパン期間、最大スパン期間、最小トレースコスト、最大トレースコストでフィルターします。 スパンフィルターの単位はナノ秒(ns)です。チャートにはスパンがミリ秒(ms)で表示されます。
フィルターのアクセシビリティ
スパンが詳細ビューに展開されると、 フィルターボタンは非表示になります。 フィルターを適用したチャートビューに戻るには、 詳細パネルを表示しないをクリックします。
トレースに含まれるスパンとトレースの詳細を確認するには、トレーステーブルのトレース行をクリックします。 スパンの色は、スパンサービス(通常はデプロイ)に対応します。 スパンに関連付けられたデプロイまたはサービスへのアクセス権がない場合、制限されたスパンが表示されます。 スパンはチャート形式またはリスト形式で表示できます。
スパンの詳細をコントロール
どちらのビューからでも、 テーブルを表示しないをクリックしてタイムスタンプテーブルを折りたたんだり、 詳細パネルを表示しないをクリックして展開されたトレーステーブルビューに戻ったりすることができます。
どちらのビューでも、スパンサービス名をクリックして、デプロイまたはリソースにアクセスします(アクセス権がある場合)。 生成AIモデルまたはエージェントワークフローの設定に応じた追加情報を、情報、リソース、イベント、入力/出力、エラー、ログの各タブで入手できます。 エラータブは、トレースでエラーが発生した場合にのみ表示されます。
トレースログをフィルター¶
リストビューから、スパンのOTelログを表示できます。 表示される結果は完全なデプロイログのサブセットであり、以下のようにアクセスされます。
-
リストビューを開き、トレースの詳細でスパンを選択します。
-
ログタブをクリックします。
-
ログを表示をクリックします。
Tracing table OTel attributes¶
For Cost, Prompt, Completion, and Tools, DataRobot reads specific span attributes across all spans that belong to the trace. Other columns (such as Timestamp and Duration) come from trace and span metadata rather than these attributes.
| 列 | OpenTelemetry mapping |
|---|---|
| コスト | Sums numeric values from the datarobot.moderation.cost attribute on spans in the trace (when that attribute is present). |
| プロンプト | Uses the gen_ai.prompt attribute. If more than one span includes gen_ai.prompt, the first value encountered in trace order is shown. |
| 補完 | Uses the gen_ai.completion attribute. If more than one span includes gen_ai.completion, the last value encountered in trace order is shown. |
| ツール | Collects every distinct value of the tool_name attribute found on spans in the trace and lists those tool names in the column. |
Attribute keys must match exactly (including the underscore in gen_ai). Names such as genai.prompt or GenAI.prompt are not read for the Prompt and Completion columns.
Automatic instrumentation (including DataRobot agent templates) often sets gen_ai.prompt, gen_ai.completion, and sometimes tool_name. For custom or external models, frameworks differ: tool execution may not emit tool_name even when tools run (for example, some LangGraph callback flows). In that case Prompt and Completion can populate while Tools remains empty until tool_name is configured on a span that runs inside the tool—see Implement tracing.
レート制限されたリクエストテーブル¶
The Rate limited requests table provides a detailed breakdown of rate limiting by entity:
| テーブル要素 | 説明 | |
|---|---|---|
| 1 | Entity type filter | Filter the table by entity type (user or agent). |
| 2 | Rate limited percentage filter | Filter entities by their rate limited percentage threshold (zero, low, medium, or high). |
| 3 | Search box | Search for specific entities by name or identifier. |
| 4 | Entity column | Displays the entity identifier (user email or agent name). |
| 5 | Rate limited requests column | Shows the number of rate limited requests and the percentage of total requests that were rate limited. The percentage is highlighted in red when it exceeds a threshold, or displayed in gray when it is 0%. |
| 6 | Requests column | Displays the number of requests that were rate limited due to exceeding the request quota. |
| 7 | Token count column | Displays the number of requests that were rate limited due to exceeding the token quota. |
| 8 | Concurrent requests column | Displays the number of requests that were rate limited due to exceeding the concurrent requests quota. |
The table helps identify which entities are experiencing rate limiting and to what extent, allowing you to adjust quotas or usage patterns accordingly.











