Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

GenAIの基本ステップ

この基本ステップでは、DataRobotのGenAIで、事前にトレーニングされたさまざまな大規模言語モデル(LLM)を使ってテキストコンテンツを生成する方法を紹介します。 または、ベクターデータベースを構築し、LLMプロンプトでそれらを活用することによって、コンテンツをドメイン固有のデータに合わせて調整することもできます。

この基本ステップでは、次のことを行います。

  1. プレイグラウンドの作成。
  2. ベクターデータベースの作成。
  3. LLMブループリントの構築と比較

前提条件

DataRobotのドキュメントに基づく以下のデモデータセットをダウンロードして、GenAIの機能を試します。

デモデータをダウンロード

1. プレイグラウンドの追加

もう1つのタイプのユースケースアセットであるプレイグラウンドは、LLMブループリントを作成して操作するためのスペースで、それぞれのレスポンスを比較して、ビジネス上の問題を解決するために本番環境でどれを使用するかを決定します。 ワークベンチでユースケースを作成し、プレイグラウンドタブまたは追加ドロップダウンを使用してプレイグラウンドを追加します。

詳しくはこちら:ユースケースの作成, プレイグラウンドの追加

2. ベクターデータベース(VDB)に内部データを追加する

特定分野のデータを使って結果を調整するには、データをLLMブループリントに割り当てて、RAGの処理中に利用します。 (ベクターデータベースから提供される基礎知識なしで、LLMブループリントの回答をテストすることもできます。 これを行うには、ステップ4に進んでLLMブループリントを設定します。)

ローカルファイルやデータ接続、またはAIカタログからユースケースに直接データを追加できます。 この基本ステップでは、データを直接追加します。

上でダウンロードしたデータdatarobot_english_documentation_5th_December.zipを、作成したユースケースに追加します。

詳しくはこちら:内部データの追加, AIカタログからのインポート

3. ベクターデータベースを追加

VDBを追加しない場合、プロンプトへの回答は、DataRobotの関連ドキュメントによって拡張されません。LLMの回答には、インターネット上のデータに関するトレーニングで取得できた詳細情報のみが含まれます。 代わりに、上で追加したデータを関連付けると、より完全な情報が得られます。

VDBを追加するには、さまざまな方法があります。 たとえば、ユースケースのデータタブから:

表示されるベクターデータベースを作成ページで、以下の内容を設定または確認し、ベクターデータベースを作成をクリックします。

設定 説明 以下に設定...
名前 設定を反映したベクターデータベース名に変更します。 datarobot docs - jina 20% / 256
データソース これがアップロードしたデータであることを確認します。 datarobot_english_documentation_5th_December.zip
埋め込みモデル 選択済みのオプションを維持して、推奨モデルを使用します。 jinaai/jina-embedding-t-en-v1
チャンクのオーバーラップ この値は、DataRobotのドキュメントを小さなテキストチャンクに分けてベクターデータベースに埋め込む際、連続性を維持するのに役立ちます。 20%

詳しくはこちら:VDBの追加, 埋め込み

4. LLMブループリントの追加と設定

ステップ1で作成したプレイグラウンドを開きます。ここから、LLMブループリントを作成し、それを操作して微調整し、比較や将来のデプロイに備えて保存するためのコントロールにアクセスできます。 ブループリントの名前をわかりやすいものに変更し、設定ドロップダウンからベースモデルとなるLLMを選択します。 この基本ステップでは、Azure OpenAI GPT-3.5 Turboモデルを使用します。

必要に応じて、設定を変更したり、システムプロンプトを追加したりしてから、ベクターデータベースを選択します。

詳しくはこちら:LLMブループリントの設定

5. プロンプトを送信

チャットは、プロンプトを送信してLLMから回答を受信するアクティビティです。 LLMの設定が完了したら、(中央下部のパネルにある入力ボックスから)LLMにプロンプトを送信します。 チャットを開始すると、LLMの選択がロックされます。

例:Write a Python program to run DataRobot Autopilot

詳しくはこちら:チャット

6. プロンプトを追加してフォローアップ

プレイグラウンドでは、LLMブループリントを保存する前に、設定の改善が必要かどうかを判断するためにフォローアップの質問をすることができます。 LLMはコンテキストを認識するので、以前の会話履歴を参照して、追加のプロンプトで「ディスカッション」を続けることができます。

前の会話の中から、「そのコード」に変更を加えるようLLMに依頼します。

回答とともに報告される信頼性スコアと引用は、回答の信頼度を測るのに役立ちます。

詳しくはこちら:信頼性スコア

7. ドラフトの保存

プレイグラウンドを使用して、システムプロンプトと設定に満足するまでプロンプトをテストおよびチューニングします。 次に、右側のパネルの下部またはメニューからLLMブループリントとして保存をクリックします。 ブループリントを保存すると、他のブループリント設定と比較できますが、保存すると、そのブループリントの設定が行われることに注意してください。 (保存後に修正を加えるには、新しいドラフトにコピーをクリックします。)

詳しくはこちら:ブループリントのアクション

8. 比較用LLMブループリントの作成

比較を実行するには、1つ以上のLLMブループリントを追加作成する必要があります。 このステップでは、VDBを使用しないLLMブループリントを作成します。

作成したLLMブループリントのメニューをクリックして、新しいドラフトにコピーを選択します。

コピーの名前をChat with docs--no VDBなどに変更し、割り当てられているベクターデータベースを削除します。

LLMブループリントとして保存をクリックします。

9. LLMブループリントの比較を設定する

これで、プレイグラウンドに複数のLLMブループリントがあるので、回答を並べて比較できます。 比較タブをクリックし、比較するブループリントを3つまで選択します。

ブループリントの情報は、VDBを利用しないバージョンを示しています。

詳しくはこちら:ブループリントの比較

10. LLMブループリントの比較

比較を開始するには、両方のブループリントにプロンプトを送信します。 両者の回答から、VDBから基礎知識を得たブループリントのほうが、より包括的で有用な回答を提供することがわかりました。

ベクターデータベースを使用するLLMブループリントからの回答には、引用リンクが含まれています。 このリンクをクリックすると、LLMに送信されたプロンプトを拡張するためにブループリントが取得したテキストチャンクが表示されます。

LLMブループリントの結果に満足したら、モデルワークショップに送信を選択して登録し、最終的にデプロイすることができます。

詳しくはこちら:LLMのデプロイ


更新しました May 2, 2024