Skip to content

ベクターデータベースの登録とデプロイ

ベクターデータベースタブには、ユースケースに関連付けられているすべてのベクターデータベース(DataRobotがホストするものと接続されたもの)が一覧表示されます。 DataRobotがホストするベクターデータベースの場合、エントリーには、親から派生したバージョンに関する情報が含まれます。ベクターデータベースのバージョニングの詳細については、バージョニングのセクションを参照してください。 接続されたベクターデータベースには1つのバージョンしかありませんが、そのバージョンにデータを追加できます。

ベクターデータベースタブにある各ベクターデータベースについて、アクションメニュー を使用すると、プロバイダーのタイプに応じて2つの方法でベクターデータベースを本番環境に送信できます。 例:

方法 説明
ワークショップに送信 ベクターデータベースをワークショップに送信して、変更およびデプロイします。
このバージョンをデプロイ(DataRobotがホスト) 選択した予測環境に最新バージョンのベクターデータベースをデプロイします。
ベクターデータベースをデプロイ(接続) 選択した予測環境にベクターデータベースをデプロイします。

ワークショップに送信

プレイグラウンドからワークショップにベクターデータベースを送信するには、ワークショップに送信をクリックし、以下の情報を入力します。

フィールド 説明
メモリー カスタム推論モデルに割り当てることのできるメモリーの最大量を決定します。 設定された最大値以上のメモリーが割り当てられたモデルはシステムによって排除されます。 この問題がテスト中に発生した場合、テストは失敗としてマークされます。 モデルのデプロイ時に発生した場合は、Kubernetesによってモデルが自動的に再起動されます。
バンドル プレビュー機能 組織で有効になっている場合、メモリーの代わりにリソースバンドルを選択します。 リソースバンドルを使用すると、さまざまなCPUおよびGPUハードウェアプラットフォームから選択して、ワークショップでカスタムモデルを構築およびテストできます。
レプリカ カスタムモデルの実行時にワークロードのバランスを取るために、並行して実行するレプリカの最大数を設定します。 レプリカの数を増やしても、カスタムモデルの速度に依存するため、パフォーマンスが向上しない場合があります。
ネットワークアクセス プレミアム機能。 カスタムモデルのエグレストラフィックを設定します。
  • パブリック:デフォルト設定。 カスタムモデルは、パブリックネットワーク内の任意の完全修飾ドメイン名(FQDN)にアクセスして、サードパーティのサービスを利用できます。
  • なし:カスタムモデルはパブリックネットワークから分離されているため、サードパーティのサービスにはアクセスできません。
パブリックネットワークアクセスが有効な場合、カスタムモデルはDATAROBOT_ENDPOINTおよびDATAROBOT_API_TOKEN環境変数を使用できます。 これらの環境変数は、 ドロップイン環境または DRUM上に構築された カスタム環境を使用するすべてのカスタムモデルで使用できます。

プレミアム機能:ネットワークアクセス

_新しく_作成したカスタムモデルはすべて、デフォルトでパブリックネットワークにアクセスできます。ただし、2023年10月より前に作成されたカスタムモデルの新しいバージョンを作成した場合、その新しいバージョンは、パブリックアクセスを有効にする(アクセスをパブリックに設定する)まで、パブリックネットワークから隔離された(アクセスがなしに設定された)ままです。 パブリックアクセスを有効にすると、後続の各バージョンは、前のバージョンのパブリックアクセス定義を継承します。

プレビュー機能:リソースバンドル

カスタムモデルのリソースバンドルとGPUリソースのバンドルは、デフォルトではオフになっています。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。

機能フラグ:リソースのバンドルを有効にする、カスタムモデルでGPUを使用した推論を有効にする(プレミアム機能

次に、ワークショップに送信をクリックします。 ベクターデータベースが正常に作成されると、ワークショップにリダイレクトされます。

ベクターデータベースのバージョンをデプロイする

プレイグラウンドからコンソールにベクターデータベースをデプロイするには、このバージョンをデプロイ(DataRobotがホスト)またはベクターデータベースをデプロイ(接続)をクリックして、以下の情報を入力します。

フィールド 説明
予測環境を選択 デプロイされたベクターデータベースの予測環境を決定します。 正しい予測環境(プラットフォーム:DataRobotサーバーレス)が選択されていることを確認します。
メモリー カスタム推論モデルに割り当てることのできるメモリーの最大量を決定します。 設定された最大値以上のメモリーが割り当てられたモデルはシステムによって排除されます。 この問題がテスト中に発生した場合、テストは失敗としてマークされます。 モデルのデプロイ時に発生した場合は、Kubernetesによってモデルが自動的に再起動されます。
バンドル プレビュー機能 組織で有効になっている場合、メモリーの代わりにリソースバンドルを選択します。 リソースバンドルを使用すると、さまざまなCPUおよびGPUハードウェアプラットフォームから選択して、ワークショップでカスタムモデルを構築およびテストできます。
レプリカ カスタムモデルの実行時にワークロードのバランスを取るために、並行して実行するレプリカの最大数を設定します。 レプリカの数を増やしても、カスタムモデルの速度に依存するため、パフォーマンスが向上しない場合があります。
ネットワークアクセス プレミアム機能。 カスタムモデルのエグレストラフィックを設定します。
  • パブリック:デフォルト設定。 カスタムモデルは、パブリックネットワーク内の任意の完全修飾ドメイン名(FQDN)にアクセスして、サードパーティのサービスを利用できます。
  • なし:カスタムモデルはパブリックネットワークから分離されているため、サードパーティのサービスにはアクセスできません。
パブリックネットワークアクセスが有効な場合、カスタムモデルはDATAROBOT_ENDPOINTおよびDATAROBOT_API_TOKEN環境変数を使用できます。 これらの環境変数は、 ドロップイン環境または DRUM上に構築された カスタム環境を使用するすべてのカスタムモデルで使用できます。

次に、デプロイをクリックします。 ベクターデータベースが正常にデプロイされると、コンソールにリダイレクトされます。

ベクターデータベースのデプロイでは、どのような監視が可能ですか?

デプロイタイプがベクターデータベースのデプロイでは、ベクターデータベースに関連するカスタム指標が自動的に生成されます。たとえば、Total Documents、Average Documents、Total Citation Tokens、Average Citation Tokens、VDB Score Latencyなどです。 ベクターデータベースのデプロイでは、サービス正常性の監視も可能です。 ベクターデータベースのデプロイでは、データ探索のために予測行レベルのデータが保存されることはありません。