Data Prep用のGoogle Cloud Storage コネクター¶
ユーザーペルソナ:Data Prepユーザー、Data Prep管理者、またはデータソース管理者
備考
この文書は、コネクターの設定中に利用できるすべての構成フィールドについて論じています。 一部のフィールドは、設定の以前の手順で管理者によってすでに入力されている場合があり、表示されない場合があります。 Data Prepのコネクターフレームワークの詳細については、Data Prepコネクターのセットアップを参照してください。 また、管理者がこのコネクタにデータソースのリストで別の名前を付けている可能性があります。
Data Prepの設定¶
このコネクターを使用すると、Google Cloud Storage(GCS)に接続して、オブジェクトを参照およびインポートできます。以下のフィールドを使用してデータ ソースへの接続を作成します。
一般¶
-
名前:UIでユーザーに表示されるデータソースの名前。
-
説明:UIでユーザーに表示されるデータソースの説明。
ヒント
Data Prepは複数のGCSアカウントに接続できます。わかりやすい名前を使用すると、ユーザーが適切なデータソースを識別する上で非常に役立ちます。
Google Cloud Storageの設定¶
-
バケット名:Google Cloud Storage バケットは、Google Cloud Storage内のオブジェクトの集合を表します。
-
オブジェクトプレフィックス:プレフィックスは、バケット内のフォルダーまたはサブフォルダーです。バケットで使用する接頭辞を選択します。すべてのオブジェクトを表示するデフォルト値は「/」です。
-
JSON Web Token:アカウントの認証には、Google Cloud StorageのJSON Web Tokenが必要です。Google Cloud Storage とのセキュリティで保護された接続を確立する JWT ファイルの内容を指定してください。JWT の詳細については、「サーバー間のアプリケーションで OAuth 2.0 を使う」に関するGoogleのドキュメントを参照してください。
Webプロキシ設定¶
-
プロキシサーバーを介してGoogle Cloud Storageに接続する場合、これらのフィールドでプロキシの詳細を定義します。
-
Webプロキシ:プロキシが不要な場合は「なし」、プロキシサーバー経由でGoogle Cloud Storageに接続する必要がある場合は「プロキシ」を選択します。Webプロキシサーバーが必要な場合、プロキシ接続を有効にするには以下のフィールドが必要です。
-
プロキシホスト:Web プロキシ サーバーのホスト名または IP アドレスです。
-
プロキシポート:データソースのプロキシサーバー上のポートです。
-
プロキシ ユーザー名:プロキシ サーバーのユーザー名です。
-
プロキシパスワード:プロキシサーバーのパスワードです。 *認証されていないプロキシ接続の場合は、ユーザー名とパスワードを空欄にしてください。
-
Googleで認証する方法¶
Data Prep Google Cloud Storageコネクターは、サービスアカウント認証を利用します。
Data Prepを使用してGoogle Cloud Storageにアクセスするには、次のことを行う必要があります。
-
Cloud Storageサービス用のGoogleサービスアカウントを作成します。
- Google Cloud Platform Consoleで資格情報のリストを開きます:https://console.cloud.google.com/apis/credentials。
- 資格情報を作成するをクリックします。
- サービスアカウントキーを選択します。
- サービスアカウントキーを作成する ウィンドウで、サービスアカウントの下のドロップダウンボックスをクリックしてから、新しいサービスアカウントをクリックします。
- 名前にサービスアカウントの名前を入力します。
- Cloud Storageロールを選択して、サービスアカウントに必要なアクセスレベルを付与します。
- デフォルトのサービスアカウントIDを使用するか、または別のアカウントを生成します。
- キータイプ:JSONを選択します。
-
作成をクリックします。
サービスアカウントの作成画面が表示され、選択したキータイプの秘密鍵が自動的にダウンロードされます。ダウンロードした資格情報の場所を覚えておいてください。 10. 閉じるをクリックします。 2. Cloud Storageサービス用の既存のサービスアカウントのJSON認証情報をダウンロードします。 1. エンドユーザーアカウントを使用してGoogle Consoleにログインします:https://console.cloud.google.com/apis/credentials。
-
ドロップダウンリストで正しいプロジェクトが選択されていることを確認してください。
-
「OAUTH 2.0クライアントID」セクションまでスクロールします。
-
コネクターで使用する予定の既存のID名をクリックします。
- 表示されたページで、「JSONのダウンロード」リンクをクリックします。
- ダウンロードした資格情報の場所を覚えておいてください。
追加のリファレンスについては、https://cloud.google.com/storage/docs/authentication#generating-a-private-keyを参照してください。
データインポート情報¶
ブラウジング経由¶
設定されたバケット/プレフィックス内のディレクトリとファイルを参照します。