Data Prep用のGoogle BigQueryコネクター¶
ユーザーペルソナ:Data Prepユーザー、Data Prep管理者、データソース管理者、またはIT/DevOps
備考
この文書は、コネクターの設定中に利用できるすべての構成フィールドについて論じています。 一部のフィールドは、設定の以前の手順で管理者によってすでに入力されている場合があり、表示されない場合があります。 Data Prepのコネクターフレームワークの詳細については、Data Prepコネクターのセットアップを参照してください。 また、管理者がこのコネクタにデータソースのリストで別の名前を付けている可能性があります。
Data Prepの設定¶
このコネクターを使用すると、BigQueryに接続して、利用可能なデータをインポートおよびエクスポートできます。ここで設定する必要があるフィールドは、管理者がどのようにコネクターを設定したかによって異なります。
一般¶
- 名前:UIでユーザーに表示されるデータソースの名前です。
- 説明:UIでユーザーに表示されるデータソースの説明です。
ヒント
Data Prepは複数のBigQueryアカウントに接続できます。わかりやすい名前を使用すると、ユーザーが適切なデータソースを識別する上で非常に役立ちます。
BigQueryの設定¶
-
OAuth検証キー:BigQueryでの認証に使用される検証キーです。検証キーを取得するには、"Test Data Source"(データソースをテスト)リンクをクリックして、BigQueryへのアクセスを許可します。アクセスを許可すると、アクセスコードを表示するページにリダイレクトされます。このフィールドにコードをコピーします。
-
プロフィール:接続するGCPプロジェクトのIDです。
-
テーブルを自動的に作成(オプション):有効にした場合、Data Prepは、エクスポートされたデータセットと名前が一致するテーブルを削除し(存在する場合)、エクスポートされたデータセットを使用してテーブルを再作成します。無効にした場合、Data Prepはテーブルがすでに作成されているという想定の下にテーブルへのエクスポートを試行します。
エクスポート用のGoogle Cloud Storage設定¶
これらのフィールドは、BigQueryへのエクスポートを実行するために必要です。インポートだけを行う場合は、これらのフィールドを空白のままにすることができます。
備考
両方を指定するか、どちらも空白のままにする必要があります。
-
Google Cloud Storageバケット名:エクスポートのステージング領域として使用されるGoogle Cloud Storageバケット名です。
-
Google Cloud Storage JSON Webトークン:Google Cloud Storageへの接続に使用されるJSON Web Token(JWT)の内容です。
Webプロキシ¶
プロキシサーバーを介してBigQueryに接続する場合、これらのフィールドでプロキシの詳細を定義します。
- Webプロキシ:プロキシが不要な場合は「なし」を選択し、プロキシサーバー経由でBigQueryに接続する必要がある場合は「プロキシ」を選択します。Webプロキシサーバーが必要な場合、プロキシ接続を有効にするには以下のフィールドが必要です。
- プロキシホスト:プロキシサーバーのホスト名またはIPアドレスです。
- プロキシ ポート: プロキシ サーバーのポートです。
- プロキシ ユーザー名とプロキシ パスワード: 認証されたプロキシ接続のユーザー資格情報です。非認証プロキシ接続では、これらを空白のままにしてください。
データインポート情報¶
ブラウジング経由¶
-
設定で指定されたプロジェクト内のデータセットとテーブルを表示します。プロジェクトは、ブラウジングビューの最上位ディレクトリとして表示されます。
-
データセット内のテーブルを参照し、インポート用テーブルを「選択」します。
SQLクエリー経由¶
- SQLのSelectクエリーの使用。
使用法¶
クエリー内の各テーブル名には一重引用符で囲み、ドット区切りは一重引用符の外で行う必要があります。
有効な構文
SELECT * FROM `my-project`.`paxata`.`test`
無効な構文
SELECT * FROM `my-project.paxata.test`