モデルリソースの管理¶
カスタム推論モデルを作成した後、モデルが消費するリソースを設定して、スムーズなデプロイを促進し、本番環境で発生する可能性のある環境エラーを最小限に抑えることができます。
アセンブルタブからカスタムモデルのリソース割り当てを監視できます。 リソース設定は、デプロイステータスの下に一覧表示されます。
リソース設定を編集するには、鉛筆アイコン()を選択します。 ユーザーはモデルに割り当てられた最大メモリーを決定できますが、追加のリソース設定を設定できるのは組織管理者だけです。
注意
DataRobotでは、必要な場合にのみリソース設定を行うことをお勧めします。 以下のメモリー設定では、Kubernetesメモリーの「制限」(メモリーの最大許容量)が設定されます。ただし、メモリーの「リクエスト」(メモリーの最小許容量)を設定することはできません。 このため、「制限」値をデフォルトの「リクエスト」値より大きく設定することができます。 メモリーの「リクエスト」と増加した「制限」によるメモリー許容量との不均衡が生じ、カスタムモデルがメモリー使用量の上限を超える場合があります。 その結果、カスタムモデルの頻繁な削除や再起動により、カスタムモデルが実行時に不安定になる場合があります。 メモリー設定を増やす必要がある場合は、組織レベルで「リクエスト」を増やすと、この問題を軽減できます。詳細については、DataRobotサポートまでお問い合わせください。
モーダルに表示されるリソース割り当てを設定します。
リソース | 説明 |
---|---|
メモリー | カスタム推論モデルに割り当てることのできるメモリーの最大量を決定します。 割り当てられた量を超えるモデルはシステムによって排除されます。 この問題がテスト中に発生した場合、テストは失敗としてマークされます。 モデルのデプロイ時に発生した場合は、Kubernetesによってモデルが自動的に再起動されます。 |
レプリカ | カスタムモデルの実行時にワークロードのバランスを取るために、並行して実行するレプリカの最大数を設定します。 レプリカの数を増やしても、カスタムモデルの速度に依存するため、パフォーマンスが向上しない場合があります。 |
リソース | 説明 |
---|---|
メモリー | カスタム推論モデルに割り当てることのできるメモリーの最大量を決定します。 設定された最大値以上のメモリーが割り当てられたモデルはシステムによって排除されます。 この問題がテスト中に発生した場合、テストは失敗としてマークされます。 モデルのデプロイ時に発生した場合は、Kubernetesによってモデルが自動的に再起動されます。 |
レプリカ | カスタムモデルの実行時にワークロードのバランスを取るために、並行して実行するレプリカの最大数を設定します。 レプリカの数を増やしても、カスタムモデルの速度に依存するため、パフォーマンスが向上しない場合があります。 |
ネットワークアクセス | カスタムモデルの発信トラフィックを設定します。 アクセスなし、またはパブリックアクセスのいずれかを選択します。 |
モデルのリソース設定が完了したら、保存をクリックします。 編集したリソース設定が適用された新しいバージョンのカスタムモデルが作成されます。