Data Prep用のMS Azure Synapse Analyticsコネクター¶
ユーザーペルソナ:Data Prepユーザー、Data Prep管理者、データソース管理者、またはIT/DevOps
備考
この文書は、コネクターの設定中に利用できるすべての構成フィールドについて論じています。 一部のフィールドは、設定の以前の手順で管理者によってすでに入力されている場合があり、表示されない場合があります。 Data Prepのコネクターフレームワークの詳細については、Data Prepコネクターのセットアップを参照してください。 また、管理者がこのコネクタにデータソースのリストで別の名前を付けている可能性があります。
Data Prepの設定¶
このコネクターを使用すると、Azure Synapse Analyticsに接続して、ライブラリのインポートとエクスポートを行うことができます。エクスポートの場合、コネクターはデータをAzure Data Lakeサービスにアップロードし、SQL Data Warehouseのテーブルとしてデータを公開します。
コネクタの作成に使用されるパラメーターに関する情報を以下に示します。
一般¶
-
名前:UIでユーザーに表示されるデータソースの名前。
-
説明:UIでユーザーに表示されるデータソースの説明。
ヒント
Data Prepは、複数のAzure Synapse Analyticsアカウントに接続できます。わかりやすい名前を使用すると、ユーザーが適切なデータソースを識別する上で非常に役立ちます。Data Prep SaaSを使用している場合は、Data Prep DevOpsにこのセットの希望の旨をお知らせください。
データベース URL¶
データベース URL には、Java Database Connectivity(JDBC)の接続文字列を指定します。この文字列は、インポートおよびエクスポートするデータベースの場所をData Prepに通知します。URL にはスキーマの名前を含めることができます。
可視性の設定¶
インポート中にユーザーがデータソースを参照するときに表示されるデータベース、スキーマ、およびテーブルを制御できます。データベース、スキーマ、およびテーブルの場合、次のいずれかを選択できます。
- [表示のみ]: ここで指定したデータベース、スキーマ、またはテーブルだけが返されます。
- [非表示]: ここで指定したデータベース、スキーマ、テーブルが非表示になります。
- [すべて表示]:データソース内のすべてを表示するデフォルト設定です。
[表示のみ]または[非表示]オプションを選択すると、オプションを適用するデータベース、スキーマ、またはテーブルを指定するフィールドが表示されます。
備考
これらの設定は、ユーザーがデータソースに対してクエリーを実行する場合は適用されません。クエリー結果は、一致の完全なリストを返します。たとえば、特定のデータベースを[非表示]にすることを選択した場合、クエリー結果には、返される結果にそのデータベースが含まれます。ただし、そのデータベースは、ユーザーがデータソースを参照するときに表示されません。
インポート設定¶
インポート設定では、データをData Prepにインポートする方法を指定できます。
- クエリーフェッチサイズ:インポート時にデータを取得する際のバッチごとの行数。
- インポート前のSQL: テーブルのスキーマを決定した後、インポートの開始前に実行するSQLステートメント。
- インポート後のSQL:インポートの完了後に実行するSQLステートメント。
エクスポート設定¶
エクスポート設定では、Data Prepからデータをエクスポートする方法を指定できます。
- エクスポート前のSQL:自動作成が有効になっている場合、テーブルの作成後、エクスポートの開始前に実行するSQLステートメント。
- エクスポート後のSQL:エクスポートの完了後に実行するSQLステートメント。
- 外部データソース名: Azure Data Lake 内のデータへのアクセスに使用する SQL Data Warehouse 内の外部データソース の名前。
備考
VARCHARの最大サイズは8000文字です。8000 バイトを超える値は空の文字列としてエクスポートされます。
資格情報¶
資格情報を設定することで、データ ソースへの接続時に認証する単一のユーザー アカウントを指定できます。
Azure Data Lake の構成¶
Azure Data Lake設定では、Data PrepがAzure Data Lakeに接続するために必要な設定を指定します。
- ADL URI:ADL サイトの URI です。
- ルートディレクトリ:データのインポート/エクスポートを有効にするディレクトリ構造の最上位を指定します。
- アプリケーションID:ADLサイトのアプリケーションIDです。
- OAUTH 2.0トークンエンドポイント:ADLサイトのOAUTH 2.0トークンエンドポイントです。
- アプリケーションアクセスキー値:ADLサイトのアプリケーションアクセスキーの値です。
データインポート情報¶
ブラウジング経由¶
テーブルを参照し、インポートするテーブルを「選択」します。
-
サポートされているデータ形式:
-
区切りデータセット:コンマ、タブ…
- xml
- JSON
- エクセル:XlsおよびXLSX
- Avro
- Parquet
-
固定フォーマット
-
エクスポート
- 使用できるエクスポート形式はJDBCの1つだけです。
- (オプション)Snowflakeテーブル名に使用される名前の編集
SQLクエリー経由¶
正当なSQL選択クエリの使用