GenAI機能に関する注意事項¶
DataRobotで生成AI機能を使用する場合は、以下の点に注意してください。 製品の開発が進むにつれ、いくつかの注意事項が変更されることがあります。
トライアルユーザー: サポートされているLLMベースモデルを含む、 DataRobotの無料トライアルに固有の注意事項を参照してください。
一般的な注意事項¶
-
UIでは、APIでサポートされる埋め込みよりもサポートされている埋め込みが少なくなります。
-
多言語データセットが多言語モデルに関連付けられた制限を超える場合、DataRobotはデフォルトで
jinaai/jina-embedding-t-en-v1
埋め込みモデルを使用します。 -
UIを介した外部/カスタムベクターデータベースまたはカスタムLLMの追加はサポートされません。
-
LLMを使用する場合、ベンダーのモデルバージョンおよびエンドオブライフ(EOL)スケジュールに注意してください。 ベストプラクティスとして、本番環境にデプロイするときには一般的に使用できるエンドポイントのみを使用してください。
-
プレイグラウンドでの単一LLMブループリントとのチャットは、以前のチャット履歴が考慮される唯一の場所です。 比較プロンプトとプレイグラウンドからデプロイされたカスタムモデルに送信されたプロンプトには、コンテキストとして以前のプロンプト(履歴)は含まれません。
-
Note that an API key named
[Internal] DR API Access for GenAI Experimentation
is created for you when you access the playground or vector database in the UI.
利用可能なLLM¶
次の表に、利用可能なLLMのタイプを示します。
タイプ | USクラスター | EUクラスター |
---|---|---|
Azure OpenAI GPT-4 | ✔ | ✔ |
Azure OpenAI GPT-4 32k | ✔ | ✔ |
Azure OpenAI GPT-3.5 Turbo 16k | ✔ | ✔ |
Azure OpenAI GPT-3.5 Turbo* | ✔ | ✔ |
Google Bison* | ✔ | ✔ |
Amazon Titan* | ✔ | ✔ |
* トライアルユーザーがクラスターに応じて使用できます。
プレイグラウンドに関する注意事項¶
-
プレイグラウンドの共有はサポートされていません。ユースケースで協業する各ユーザーには、各自が作成したプレイグラウンドのみが表示されます。
-
各ユーザーは、すべてのLLMに1日あたり1,000件のLLMプロンプトを送信できます。ここでは、削除されたプロンプトとレスポンスもカウントされます。 ただし、成功したプロンプトレスポンスペアのみがカウントされ、持ち込み(BYO)LLMコールはカウントの対象外になります。 トライアルユーザーの制限は、 ここに説明されているように異なります。
ベクターデータベースに関する注意事項¶
以下のセクションでは、 ベクターデータベースに関連する注意事項について説明します。
サポートされているデータセットタイプ¶
ベクターデータベースを作成するためにデータセットをアップロードする場合、サポートされている形式はzip
のみです。 DataRobotは.zip
を処理して、リファレンスID(ファイルパス)列が関連付けられたテキスト列を含む.csv
を作成します。 リファレンスID列は、zip
がアップロードされると自動的に作成されます。 すべてのファイルは、アーカイブのルート(root)、またはアーカイブ内の単一のフォルダーに配置する必要があります。 フォルダーツリー階層の使用はサポートされていません。
ファイルタイプに関して、DataRobotは以下をサポートします。
-
.txt
ドキュメント -
PDFドキュメント
- テキストベースのPDFがサポートされています。
- 画像ベースのPDFは完全にはサポートされていません。 したがって、画像は一般的に無視されますが、エラーは発生しません。
- 画像とテキストコンテンツが混在するドキュメントがサポートされます。テキストのみが解析されます。
- 画像だけで構成される単一のドキュメントは空のドキュメントになり、無視されます。
- 画像のみのドキュメント(テキストなし)で構成されるデータセットは処理できません。
-
単一のデータセット内のPDFと
.txt
ドキュメントの混合がサポートされています。
データセット制限¶
グローバル1GBデータセット制限は、テキストがドキュメントから抽出された後、ベクターデータベースの作成時に適用されます。 さらなる動的制限を以下に示します。
jinaai/jina-embedding-t-en-v1
:1 GBまでのグローバル制限でサポートされていますsentence-transformers/all-MiniLM-L6-v2
:650 MBまでの制限でサポートされていますMultilingual-e5-base
:250 MBまでの制限でサポートされていますE5-base-v2
:250 MBまでの制限でサポートされていますE5-large-v2
:100 MBまでの制限でサポートされています
プレイグラウンドデプロイに関する注意事項¶
プレイグラウンドからLLMを登録およびデプロイする際は、以下の点に注意してください。
-
DataRobot資格情報管理システムを介したAPIキーの設定がサポートされています。 これらの資格情報は、デプロイの環境変数としてアクセスされます。
-
登録とデプロイは、以下に対してサポートされています。
-
プレイグラウンド内のすべてのベースLLM
-
ベクターデータベースを使用したLLM
-
-
ドラフトブループリントでは、登録とデプロイはサポートされて いません 。
-
大規模ベクターデータベース(500 MB以上)に関連付けられたLLMブループリントからカスタムモデルバージョンを作成すると、時間がかかる場合があります。 モデルが作成されている間、モデルワークショップを離れることができます。
トライアルユーザーに関する注意事項¶
以下の注意事項は、DataRobotの無料トライアルユーザーにのみ適用されます。
-
複数のユースケースにわたって計算された最大15のベクターデータベースを作成できます。 削除されたベクターデータベースはこの計算に含まれます。
-
300件のLLM API呼び出しを行うことができます。ここでは、削除されたプロンプトとレスポンスもカウントされます。 ただし、正常に完了したプロンプトレスポンスペアのみがカウントされます。
-
“Bring-your-own” LLMとベクターデータベースは使用できません。
利用可能なLLMのセクションも参照してください。