ベクターデータベースの登録とデプロイ¶
ベクターデータベースタブには、ユースケースに関連付けられているすべてのベクターデータベース(DataRobotがホストするものと接続されたもの)が一覧表示されます。 DataRobotがホストするベクターデータベースの場合、エントリーには、親から派生したバージョンに関する情報が含まれます。ベクターデータベースのバージョニングの詳細については、バージョニングのセクションを参照してください。 接続されたベクターデータベースには1つのバージョンしかありませんが、そのバージョンにデータを追加できます。
| 方法 | 説明 |
|---|---|
| ワークショップに送信 | ベクターデータベースをワークショップに送信して、変更およびデプロイします。 |
| このバージョンをデプロイ(DataRobotがホスト) | 選択した予測環境に最新バージョンのベクターデータベースをデプロイします。 |
| ベクターデータベースをデプロイ(接続) | 選択した予測環境にベクターデータベースをデプロイします。 |
ワークショップに送信¶
プレイグラウンドからワークショップにベクターデータベースを送信するには、ワークショップに送信をクリックし、以下の情報を入力します。
| フィールド | 説明 |
|---|---|
| メモリー | カスタム推論モデルに割り当てることのできるメモリーの最大量を決定します。 設定された最大値以上のメモリーが割り当てられたモデルはシステムによって排除されます。 この問題がテスト中に発生した場合、テストは失敗としてマークされます。 モデルのデプロイ時に発生した場合は、Kubernetesによってモデルが自動的に再起動されます。 |
| バンドル | プレビュー機能 組織で有効になっている場合、メモリーの代わりにリソースバンドルを選択します。 リソースバンドルを使用すると、さまざまなCPUおよびGPUハードウェアプラットフォームから選択して、ワークショップでカスタムモデルを構築およびテストできます。 |
| レプリカ | カスタムモデルの実行時にワークロードのバランスを取るために、並行して実行するレプリカの最大数を設定します。 レプリカの数を増やしても、カスタムモデルの速度に依存するため、パフォーマンスが向上しない場合があります。 |
| ネットワークアクセス | プレミアム機能。 カスタムモデルのエグレストラフィックを設定します。
DATAROBOT_ENDPOINTおよびDATAROBOT_API_TOKEN環境変数を使用できます。 これらの環境変数は、 ドロップイン環境または DRUM上に構築された カスタム環境を使用するすべてのカスタムモデルで使用できます。 |
プレミアム機能:ネットワークアクセス
_新しく_作成したカスタムモデルはすべて、デフォルトでパブリックネットワークにアクセスできます。ただし、2023年10月より前に作成されたカスタムモデルの新しいバージョンを作成した場合、その新しいバージョンは、パブリックアクセスを有効にする(アクセスをパブリックに設定する)まで、パブリックネットワークから隔離された(アクセスがなしに設定された)ままです。 パブリックアクセスを有効にすると、後続の各バージョンは、前のバージョンのパブリックアクセス定義を継承します。
プレビュー機能:リソースバンドル
カスタムモデルのリソースバンドルとGPUリソースのバンドルは、デフォルトではオフになっています。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。
機能フラグ:リソースのバンドルを有効にする、カスタムモデルでGPUを使用した推論を有効にする(プレミアム機能)
次に、ワークショップに送信をクリックします。 ベクターデータベースが正常に作成されると、ワークショップにリダイレクトされます。
ベクターデータベースのバージョンをデプロイする¶
プレイグラウンドからコンソールにベクターデータベースをデプロイするには、このバージョンをデプロイ(DataRobotがホスト)またはベクターデータベースをデプロイ(接続)をクリックして、以下の情報を入力します。
| フィールド | 説明 |
|---|---|
| 予測環境を選択 | デプロイされたベクターデータベースの予測環境を決定します。 正しい予測環境(プラットフォーム:DataRobotサーバーレス)が選択されていることを確認します。 |
| メモリー | カスタム推論モデルに割り当てることのできるメモリーの最大量を決定します。 設定された最大値以上のメモリーが割り当てられたモデルはシステムによって排除されます。 この問題がテスト中に発生した場合、テストは失敗としてマークされます。 モデルのデプロイ時に発生した場合は、Kubernetesによってモデルが自動的に再起動されます。 |
| バンドル | プレビュー機能 組織で有効になっている場合、メモリーの代わりにリソースバンドルを選択します。 リソースバンドルを使用すると、さまざまなCPUおよびGPUハードウェアプラットフォームから選択して、ワークショップでカスタムモデルを構築およびテストできます。 |
| レプリカ | カスタムモデルの実行時にワークロードのバランスを取るために、並行して実行するレプリカの最大数を設定します。 レプリカの数を増やしても、カスタムモデルの速度に依存するため、パフォーマンスが向上しない場合があります。 |
| ネットワークアクセス | プレミアム機能。 カスタムモデルのエグレストラフィックを設定します。
DATAROBOT_ENDPOINTおよびDATAROBOT_API_TOKEN環境変数を使用できます。 これらの環境変数は、 ドロップイン環境または DRUM上に構築された カスタム環境を使用するすべてのカスタムモデルで使用できます。 |
次に、デプロイをクリックします。 ベクターデータベースが正常にデプロイされると、コンソールにリダイレクトされます。
ベクターデータベースのデプロイでは、どのような監視が可能ですか?
デプロイタイプがベクターデータベースのデプロイでは、ベクターデータベースに関連するカスタム指標が自動的に生成されます。たとえば、Total Documents、Average Documents、Total Citation Tokens、Average Citation Tokens、VDB Score Latencyなどです。 ベクターデータベースのデプロイでは、サービス正常性の監視も可能です。 ベクターデータベースのデプロイでは、データ探索のために予測行レベルのデータが保存されることはありません。





