GenAIの基本ステップ¶

この基本ステップでは、DataRobotのGenAIで、事前にトレーニングされたさまざまな大規模言語モデル（LLM）を使ってテキストコンテンツを生成する方法を紹介します。または、ベクターデータベースを構築し、LLMプロンプトでそれらを活用することによって、コンテンツをドメイン固有のデータに合わせて調整することもできます。

この基本ステップでは、次のことを行います。

プレイグラウンドの作成。
ベクターデータベースの作成。
LLMブループリントの構築と比較

備考

プレイグラウンドで使用可能なLLMはすべて、そのまますぐに使用できます。エラーや権限の問題が発生した場合は、DataRobotサポートにお問い合わせください。

前提条件¶

DataRobotのドキュメントに基づく以下のデモデータセットをダウンロードして、GenAIの機能を試します。

デモデータをダウンロード

1. プレイグラウンドの追加¶

もう1つのタイプのユースケースアセットであるプレイグラウンドは、LLMブループリントを作成して操作するためのスペースで、それぞれのレスポンスを比較して、ビジネス上の問題を解決するために本番環境でどれを使用するかを決定します。ワークベンチでユースケースを作成し、プレイグラウンドタブまたは追加ドロップダウンを使用してプレイグラウンドを追加します。

2. ベクターデータベースに内部データを追加する¶

特定分野のデータを使って結果を調整するには、データをLLMブループリントに割り当てて、RAGの処理中に利用します。（ベクターデータベースから提供される基礎知識なしで、LLMブループリントの回答をテストすることもできます。これを行うには、ステップ4に進んでLLMブループリントを設定します。）

ローカルファイルやデータ接続、またはAIカタログからユースケースに直接データを追加できます。この基本ステップでは、データを直接追加します。

上でダウンロードしたデータdatarobot_english_documentation_5th_December.zipを、作成したユースケースに追加します。

詳しくはこちら：内部データの追加, AIカタログからのインポート

3. ベクターデータベースを追加¶

ベクターデータベースを追加しない場合、プロンプトへの回答は、DataRobotの関連ドキュメントによって拡張されません。LLMの回答には、インターネット上のデータに関するトレーニングで取得できた詳細情報のみが含まれます。代わりに、上で追加したデータを関連付けると、より完全な情報が得られます。

ベクターデータベースを追加するには、さまざまな方法があります。たとえば、ユースケースのデータタブから：

表示されるベクターデータベースを作成ページで、以下の内容を設定または確認し、ベクターデータベースを作成をクリックします。

設定	説明	以下に設定...
名前	設定を反映したベクターデータベース名に変更します。	datarobot docs --jina 20% / 256
データソース	これがアップロードしたデータであることを確認します。	datarobot_english_documentation_5th_December.zip
埋め込みモデル	選択済みのオプションを維持して、推奨モデルを使用します。	jinaai/jina-embedding-t-en-v1
チャンクのオーバーラップ	この値は、DataRobotのドキュメントを小さなテキストチャンクに分けてベクターデータベースに埋め込む際、連続性を維持するのに役立ちます。	20%

詳しくはこちら：ベクターデータベースの追加、埋め込み

4. LLMブループリントの追加と設定¶

ステップ1で作成したプレイグラウンドを開きます。ここから、LLMブループリントを作成し、それを操作して微調整し、比較や将来のデプロイに備えて保存するためのコントロールにアクセスできます。プレイグラウンドから、LLMブループリントの作成を選択し、設定を開始します。

基本モデルとして機能する設定ドロップダウンからLLMを選択します。この基本ステップでは、Azure OpenAI GPT-3.5 Turboモデルを使用します。必要に応じて、設定を変更します。

ベクターデータベースタブから、ステップ3で追加したベクターデータベースを選択します。

プロンプティングタブから、必要に応じてシステムプロンプトを追加し、コンテキストアウェアネスを変更します。この例では、ブループリントの設定をデフォルトのコンテキストアウェアのままにしています。

詳しくはこちら：LLMブループリントの設定、コンテキストアウェアネス

設定を保存します。

5. プロンプトを送信¶

チャットは、プロンプトを送信してLLMから回答を受信するアクティビティです。 LLMの設定が完了したら、チャットタブで、（中央下部のパネルにある入力ボックスから）LLMにプロンプトを送信します。

例：Write a Python program to run DataRobot Autopilot

詳しくはこちら：チャット

6. プロンプトを追加してフォローアップ¶

プレイグラウンドでは、LLMブループリントを保存する前に、設定の改善が必要かどうかを判断するためにフォローアップの質問をすることができます。 LLMはコンテキストを認識するので、以前の会話履歴を参照して、追加のプロンプトで「ディスカッション」を続けることができます。

前の会話の中から、「そのコード」に変更を加えるようLLMに依頼します。

回答とともに報告されるROUGEスコアと引用は、回答の信頼度を測るのに役立ちます。

詳しくはこちら：ROUGEスコア

7. テストと調整¶

システムプロンプトと設定が適切になるまで、設定領域を使用してプロンプトをテストおよび調整します。（最初のプロンプトを送信する前に、設定を保存する必要があります。）次に、ブループリント名の横にある編集アイコンをクリックして、たとえばGPT 3.5 with VDBのように、よりわかりやすい名前にしてから、確認をクリックします。

詳しくはこちら：ブループリントのアクション

8. 比較用LLMブループリントの作成¶

比較を実行するには、1つ以上のLLMブループリントを作成します。（比較ビューで単一のブループリントにプロンプトを送信できます。）この手順では、ベクターデータベースを使用しないLLMブループリントを作成します。

作成したLLMブループリントのメニューをクリックし、新しいLLMブループリントにコピーを選択します。

コピーの名前をGPT3.5、VDBなしなどに変更し、割り当てられているベクターデータベースを削除します。

設定を保存をクリックします。

9. LLMブループリントの比較を設定する¶

これで、プレイグラウンドに複数のLLMブループリントがあるので、回答を並べて比較できます。 LLMブループリントの比較に戻るをクリックします。

比較するブループリントを3つまで選択します。

LLMブループリントの情報は、ベクターデータベースを利用しないバージョンを示しています。

詳しくはこちら：ブループリントの比較

10. LLMブループリントの比較¶

比較を開始するには、両方のブループリントにプロンプトを送信します。両者の回答から、ベクターデータベースから基礎知識を得たブループリントのほうが、より包括的で有用な回答を提供することがわかりました。

ベクターデータベースを使用するLLMブループリントからの回答には、引用リンクが含まれています。このリンクをクリックすると、LLMに送信されたプロンプトを拡張するためにLLMブループリントが取得したテキストチャンクが表示されます。

LLMブループリントの結果に問題がなければ、LLMブループリントのアクションドロップダウンからモデルワークショップに送信を選択して登録し、最終的にデプロイすることができます。

詳しくはこちら：LLMのデプロイ

更新しました 2025年4月9日

このページは役に立ちましたか？

ありがとうございます。どのような点が役に立ちましたか？

より良いコンテンツを提供するには、どうすればよいでしょうか？

アンケートにご協力いただき、ありがとうございました。