How-to:アプリテンプレートをDataRobotデプロイに適用する¶
データと会話するエージェントでは、任意のデータソースから未処理のデータをアップロードして質問することができます。その後、エージェントがビジネス分析を提案します。 DataRobotでは、外部のLLMを使用する代わりに、業界固有および企業固有の用語や専門用語の定義を含むデータセットでトレーニングされたRAGモデルを構築し、デプロイすることが可能です。 これにより、チームの別のメンバーと同等の背景知識を持つAIエージェントが作成され、質問やデータから推論しようとしている回答にコンテキストが適用されます。
この基本ステップでは、次のことを行います。
- ユースケースを作成し、業界用語の
.zipファイルを追加します。 - ベクターデータベースを作成し、RAGプレイグラウンドを設定します。
- RAG LLMモデルを登録し、デプロイします。
- データと会話するエージェントのテンプレートをCodespaceで起動します。
- RAGモデルのデプロイIDを使用して、アプリケーションテンプレートをカスタマイズします。
- Pulumiスタックを構築します。
ダウンロードするアセット¶
この基本ステップに従って操作するには、以下のリンクから.zipファイルをダウンロードします。
上記の.zipファイルは、AIを用いて生成された一般的な金融用語とその定義のリストです。
前提条件¶
この基本ステップでは、次のものが必要です。
- DataRobotのGenAIおよびMLOps機能へのアクセス権
- DataRobot APIトークン。
- DataRobotのエンドポイント
- 業界固有の用語と定義をまとめた
.zipファイル - サーバーレス予測環境
1. ユースケースを作成し、データをアップロードする¶
ワークベンチのユースケースディレクトリで、+ ユースケースの作成をクリックします。 先に進む前に、ユースケースによりわかりやすい名前を付けることができます。
左側のナビゲーションで、データアセットタイルをクリックし、ファイルをアップロードをクリックします。 次に、コンピューターに保存されている.zipファイルを選択します。
2. ベクターデータベースを作成する¶
データセットの登録が完了したら、左側のナビゲーションでベクターデータベースタイルをクリックし、次にベクターデータベースを作成をクリックします。
表示されたウィンドウで、以下のようにフィールドに入力します。
| フィールド | 選択項目 | |
|---|---|---|
| 1 | ベクターデータベースのプロバイダー | DataRobot |
| 2 | 名前 | わかりやすい名前(この例ではfinancial_jargon)。 |
| 3 | データソース | finance_knowledge_md.md.zip(前のステップで登録した.zip)。 |
残りのフィールド(上の図ではぼかされている部分)については、デフォルト設定を使用します。 続けて、ベクターデータベースを作成をクリックします。 ベクターデータベースの構築には1〜2分かかる場合があります。
詳細については、ベクターデータベースを参照してください。
3. RAGのプレイグラウンドを作成する¶
ベクターデータベースの構築が完了したら、アクションメニュー を開き、最新バージョンからプレイグラウンドを作成を選択します。
プレイグラウンドにおいて、右側のペインでベクターデータベースタブを選択して、ベクターデータベースのバージョンドロップダウンを開き、最新バッジのついたデータベースを選択します。
プロンプトタブのシステムプロンプトフィールドに、次の内容を入力します:You are an expert financial analyst who is providing guidance on how to navigate data for analysis.(あなたは、経験豊富な金融アナリストとして、分析対象データの処理方法について指導しています。)
LLMタブでLLMドロップダウンを開き、Azure OpenAI GPT-4oを選択します。
設定を保存をクリックし、わかりやすい名前を追加します。この場合は、ttmd-finance-termsと入力します。
プレイグラウンドで、ワークショップに送信をクリックします。 次に、ベクターデータベースタブで予測環境を選択し、ワークショップに送信をクリックします。
詳細については、プレイグラウンドの概要を参照してください。
4. ワークショップからモデルの登録とデプロイを行う¶
RAGモデルを登録するには、レジストリを開き、ワークショップタイルを選択します。 プレイグラウンドから送信したモデル(ttmd-finance-terms)を選択します。
デフォルト設定を変更せずに、モデルの登録をクリックします。 表示されたウィンドウで、再度モデルの登録をクリックします。 登録が完了したら、モデルをデプロイをクリックします。
デフォルト設定を変更せずに、モデルをデプロイをクリックします。 ウィンドウが表示されます。デプロイに戻るをクリックしてコンソールを開き、デプロイの進捗状況を監視します。
デプロイ(ttmd-finance-terms)を開き、概要タブでデプロイIDをコピーします。 このIDは、アプリケーションテンプレートで使用されます。
5. データと会話するエージェントのテンプレートを開く¶
ワークベンチのユースケースディレクトリで、アプリケーションテンプレートを参照をクリックします。
データと会話するエージェントを選択し、右上隅にあるCodespaceで開くをクリックします。
この基本ステップでは、Codespaceでのアプリケーションテンプレートの操作に重点を置いていますが、リポジトリのURLをコピーをクリックし、そのURLをブラウザーに貼り付けると、GitHubでテンプレートを開くことができます。
DataRobotが開き、codespaceの初期化が開始されます。 セッションが開始されると、テンプレートファイルが左側に表示され、中央にREADMEが開きます。 Codespaceインターフェイスの詳細については、Codespaceセッションを参照してください。
ヒント
ユースケースが自動的に作成されるため、今後はユースケースディレクトリからこのcodespace(および生成されたアセット)にアクセスできます。
6. アプリケーションテンプレートを設定し、LLMデプロイを追加する¶
READMEファイルに含まれる指示に従ってください。
左側のファイルブラウザーからアクセスできる.envファイルでは、以下のフィールドが必須です。
DATAROBOT_API_TOKEN:DataRobotのユーザー設定 > APIのキーとツールから取得します。DATAROBOT_ENDPOINT:DataRobotのユーザー設定 > APIのキーとツールから取得します。PULUMI_CONFIG_PASSPHRASE:自分で選んだ英数字のパスフレーズ。USE_DATAROBOT_LLM_GATEWAY:trueに設定します。TEXTGEN_DEPLOYMENT_ID:以前にコピーしたデプロイID。
その他のパラメーターはすべて、行の先頭に#を追加してコメントアウトします。
7. Pulumiスタックを実行し、アプリケーションを開く¶
左側のパネルでターミナルタイルをクリックします。
表示されたターミナルペインでpython quickstart.py YOUR_PROJECT_NAMEを実行し、YOUR_PROJECT_NAMEを一意の名前に置き換えます。 その後、Enterを押します。
Pulumiスタックの実行には数分かかる場合があります。 完了すると、ターミナル内の結果の最後にURLが表示されます。 デプロイされたアプリケーションを表示するには、URLをコピーしてブラウザーに貼り付けます。
ヒント
レジストリにもアプリケーションが作成されます。 このアプリケーションに再度アクセスするには、レジストリ > アプリケーションに移動します。















