Skip to content

How-to:アプリテンプレートをDataRobotデプロイに適用する

データと会話するエージェントでは、任意のデータソースから未処理のデータをアップロードして質問することができます。その後、エージェントがビジネス分析を提案します。 DataRobotでは、外部のLLMを使用する代わりに、業界固有および企業固有の用語や専門用語の定義を含むデータセットでトレーニングされたRAGモデルを構築し、デプロイすることが可能です。 これにより、チームの別のメンバーと同等の背景知識を持つAIエージェントが作成され、質問やデータから推論しようとしている回答にコンテキストが適用されます。

この基本ステップでは、次のことを行います。

  • ユースケースを作成し、業界用語の.zipファイルを追加します。
  • ベクターデータベースを作成し、RAGプレイグラウンドを設定します。
  • RAG LLMモデルを登録し、デプロイします。
  • データと会話するエージェントのテンプレートをCodespaceで起動します。
  • RAGモデルのデプロイIDを使用して、アプリケーションテンプレートをカスタマイズします。
  • Pulumiスタックを構築します。

ダウンロードするアセット

この基本ステップに従って操作するには、以下のリンクから.zipファイルをダウンロードします。

業界用語データセットのダウンロード

上記の.zipファイルは、AIを用いて生成された一般的な金融用語とその定義のリストです。

前提条件

この基本ステップでは、次のものが必要です。

  • DataRobotのGenAIおよびMLOps機能へのアクセス権
  • DataRobot APIトークン。
  • DataRobotのエンドポイント
  • 業界固有の用語と定義をまとめた.zipファイル
  • サーバーレス予測環境

1. ユースケースを作成し、データをアップロードする

ワークベンチユースケースディレクトリで、+ ユースケースの作成をクリックします。 先に進む前に、ユースケースによりわかりやすい名前を付けることができます。

左側のナビゲーションで、データアセットタイルをクリックし、ファイルをアップロードをクリックします。 次に、コンピューターに保存されている.zipファイルを選択します。

2. ベクターデータベースを作成する

データセットの登録が完了したら、左側のナビゲーションでベクターデータベースタイルをクリックし、次にベクターデータベースを作成をクリックします。

表示されたウィンドウで、以下のようにフィールドに入力します。

  フィールド 選択項目
1 ベクターデータベースのプロバイダー DataRobot
2 名前 わかりやすい名前(この例ではfinancial_jargon)。
3 データソース finance_knowledge_md.md.zip(前のステップで登録した.zip)。

残りのフィールド(上の図ではぼかされている部分)については、デフォルト設定を使用します。 続けて、ベクターデータベースを作成をクリックします。 ベクターデータベースの構築には1〜2分かかる場合があります。

詳細については、ベクターデータベースを参照してください。

3. RAGのプレイグラウンドを作成する

ベクターデータベースの構築が完了したら、アクションメニュー を開き、最新バージョンからプレイグラウンドを作成を選択します。

プレイグラウンドにおいて、右側のペインでベクターデータベースタブを選択して、ベクターデータベースのバージョンドロップダウンを開き、最新バッジのついたデータベースを選択します。

プロンプトタブのシステムプロンプトフィールドに、次の内容を入力します:You are an expert financial analyst who is providing guidance on how to navigate data for analysis.(あなたは、経験豊富な金融アナリストとして、分析対象データの処理方法について指導しています。)

LLMタブでLLMドロップダウンを開き、Azure OpenAI GPT-4oを選択します。

設定を保存をクリックし、わかりやすい名前を追加します。この場合は、ttmd-finance-termsと入力します。

プレイグラウンドで、ワークショップに送信をクリックします。 次に、ベクターデータベースタブで予測環境を選択し、ワークショップに送信をクリックします。

詳細については、プレイグラウンドの概要を参照してください。

4. ワークショップからモデルの登録とデプロイを行う

RAGモデルを登録するには、レジストリを開き、ワークショップタイルを選択します。 プレイグラウンドから送信したモデル(ttmd-finance-terms)を選択します。

デフォルト設定を変更せずに、モデルの登録をクリックします。 表示されたウィンドウで、再度モデルの登録をクリックします。 登録が完了したら、モデルをデプロイをクリックします。

デフォルト設定を変更せずに、モデルをデプロイをクリックします。 ウィンドウが表示されます。デプロイに戻るをクリックしてコンソールを開き、デプロイの進捗状況を監視します。

デプロイ(ttmd-finance-terms)を開き、概要タブでデプロイIDをコピーします。 このIDは、アプリケーションテンプレートで使用されます。

5. データと会話するエージェントのテンプレートを開く

ワークベンチユースケースディレクトリで、アプリケーションテンプレートを参照をクリックします。

データと会話するエージェントを選択し、右上隅にあるCodespaceで開くをクリックします。

この基本ステップでは、Codespaceでのアプリケーションテンプレートの操作に重点を置いていますが、リポジトリのURLをコピーをクリックし、そのURLをブラウザーに貼り付けると、GitHubでテンプレートを開くことができます。

DataRobotが開き、codespaceの初期化が開始されます。 セッションが開始されると、テンプレートファイルが左側に表示され、中央にREADMEが開きます。 Codespaceインターフェイスの詳細については、Codespaceセッションを参照してください。

ヒント

ユースケースが自動的に作成されるため、今後はユースケースディレクトリからこのcodespace(および生成されたアセット)にアクセスできます。

6. アプリケーションテンプレートを設定し、LLMデプロイを追加する

READMEファイルに含まれる指示に従ってください。

左側のファイルブラウザーからアクセスできる.envファイルでは、以下のフィールドが必須です。

  • DATAROBOT_API_TOKEN:DataRobotのユーザー設定 > APIのキーとツールから取得します。
  • DATAROBOT_ENDPOINT:DataRobotのユーザー設定 > APIのキーとツールから取得します。
  • PULUMI_CONFIG_PASSPHRASE:自分で選んだ英数字のパスフレーズ。
  • USE_DATAROBOT_LLM_GATEWAYtrueに設定します。
  • TEXTGEN_DEPLOYMENT_ID以前にコピーしたデプロイID。

その他のパラメーターはすべて、行の先頭に#を追加してコメントアウトします。

7. Pulumiスタックを実行し、アプリケーションを開く

左側のパネルでターミナルタイルをクリックします。

表示されたターミナルペインでpython quickstart.py YOUR_PROJECT_NAMEを実行し、YOUR_PROJECT_NAMEを一意の名前に置き換えます。 その後、Enterを押します。

Pulumiスタックの実行には数分かかる場合があります。 完了すると、ターミナル内の結果の最後にURLが表示されます。 デプロイされたアプリケーションを表示するには、URLをコピーしてブラウザーに貼り付けます。

ヒント

レジストリにもアプリケーションが作成されます。 このアプリケーションに再度アクセスするには、レジストリ > アプリケーションに移動します。