データ接続¶
ワークベンチでは、事前定義されたデータソースへのセキュアな接続を簡単に設定および再利用できます。これにより、DataRobotの統合データ準備機能を利用する前に、データをインタラクティブに参照、プレビュー、およびプロファイルすることが可能です。
重要な追加情報については、関連する注意事項を参照してください。
許可対象の送信元IPアドレス
データ接続を設定する前に、送信元IPが許可されていることを確認してください。
接続サポート¶
DataRobotで現在サポートされているすべてのコネクターおよびJDBCドライバーに接続して、データを追加できます。 サポートされているデータ接続の完全なリストについては、サポートされているデータストアを参照してください。
Snowflake、BigQuery、Databricksの接続ではプッシュダウンラングリングが使用され、その他のすべての接続ではSparkラングリングが使用されます。
以下の表は、各ラングリング方法でサポートされる機能をまとめたものです。
| ラングリング方法 | スナップショットデータセット | 動的データセット | ライブプレビュー | ラングリング | ソース内マテリアライズ |
|---|---|---|---|---|---|
| プッシュダウンラングリング:Snowflake、BigQuery、Databricks | ✔ | ✔ | ✔ | ✔ | |
| Sparkラングリング:ローカルファイル、公開URL、およびすべてのサポートされている接続からアップロードされたスナップショット | ✔ | ✔ |
JDBCドライバーの機能
スナップショットデータセットは、JDBCドライバーの接続からのみ追加できます。
データソースへの接続¶
データ接続を作成すると、コネクターとJDBCドライバーの両方から外部ソースデータを探索し、それをユースケースに追加できます。
データ接続を作成するには:
-
データアセットタイルの右上隅にあるデータを追加 > データを参照をクリックし、データを参照モーダルを開きます。
-
+ 接続を追加をクリックします。
-
構造化データの追加をサポートする接続には構造化を、非構造化データをサポートする接続には非構造化を選択します。 続いて、データストアを選択します。
これで、 データ接続を設定できます。
接続の設定¶
備考
データ接続を設定する際、設定タイプ、認証オプション、必須パラメーターは、選択したデータソースに基づいています。 以下の例では、新しい資格情報を用いたOAuthでSnowflakeを設定する方法を紹介します。
データ接続を設定するには:
-
接続を編集モーダルで接続設定タブを選択し、パラメーターまたはJDBC URLのいずれかの設定方法を選択します。
-
選択した設定方法に必要なパラメーターを入力します。
-
新しい資格情報をクリックし、認証方法を選択します。利用可能な認証方法は選択された接続に基づきます。
保存済みの資格情報
以前に 選択したデータソースの資格情報を保存している場合は、資格情報を保存をクリックして、ドロップダウンから適切な資格情報を選択します。
-
右上隅の保存をクリックします。 ブラウザーのウィンドウが小さい場合は、上方向にスクロールする必要があります。
認証方法としてOAuthを選択した場合、 データセットを選択する前にサインインするよう求められます。 サポートされている認証方法と必要なパラメーターの詳細については、サポートされているデータストアのリストを参照してください。
データセットを選択¶
データ接続の設定が完了すると、アクセスできる データベーススキーマとテーブルを参照することでデータセットを追加できます。
データセットを選択するには:
-
追加するテーブルに関連付けられたスキーマを選択します。
-
該当するテーブルの左側にあるボックスを選択します。
データセットを選択すると、以下の操作を行うことができます。
要素 説明 1 ユースケースに追加 データアセットをユースケースに追加し、自分や他のチームメンバーが使用できるようにします。 2 SQLクエリーから追加 SQLクエリーを使用してデータを追加できます。 3 設定 列の表示、非表示、ピン留めができます。 4 アクションメニュー 以下のアクションにアクセスできます。 - プレビュー:スナップショットのプレビューを開き、データセットがユースケースに関連しているかどうかや、ラングラーまたはSQLエディターで修正する必要があるかどうかを判断します。
- ラングラーで開く:ユースケースにアセットを追加する前に、データの準備を行います。
- SQLエディターで開く:データセットを強化、変換、整形、およびブレンドするSQLクエリーで構成されたレシピを作成します。
大規模データセット
ユースケースに追加する前にデータセットのサイズを小さくする場合は、ラングリングをクリックします。 レシピをパブリッシュするとき、 自動ダウンサンプリングを設定して、Snowflakeが出力データセットをマテリアライズするときの行数を制御することができます。
接続の編集¶
データを参照モーダルから、関連付けられた資格情報やデータソースだけでなく、設定パラメーターを含む既存のデータ接続を変更することができます。
接続を編集するには、データ接続にカーソルを合わせて、編集アイコン をクリックします。
各タブの説明(各タブにどのような情報が表示され、どのような編集オプションを利用できるか)については、以下を参照してください。
データソースタブには、接続に関連付けられたすべてのデータアセットが表示されます。 これには、データ接続を介して手動で追加されたデータに加え、データ接続からデータレジストリまたはユースケースにデータセットやファイルが追加されるたびに自動的に追加されるデータも含まれます。 ここから、次のことができます。
| 要素 | 説明 | |
|---|---|---|
| 1 | 検索 | 特定の資格情報を検索できます。 |
| 2 | 列 | 名前およびデータが最後に更新された日付を表示します。 |
| 3 | アクションメニュー | 以下のアクションにアクセスできます。
|
資格情報タブには、自分が追加または共有したすべてのSnowflake資格情報が表示されます。 ここから、次のことができます。
| 要素 | 説明 | |
|---|---|---|
| 1 | 検索 | 特定の資格情報を検索できます。 |
| 2 | 列 | 名前、資格情報のタイプ、および資格情報が最初に追加された日付を表示します。 |
| 3 | 選択されたバッジ | データ接続で現在使用されている資格情報を示します。 |
| 4 | アクションメニュー | 以下のアクションにアクセスできます。
|
接続の編集が終了したら、保存をクリックします。
続けて読む¶
このページで説明されているトピックの詳細については、以下を参照してください。










