Data Prep用のAmazon Athenaコネクター¶
ユーザーペルソナ:Data Prepユーザー、Data Prep管理者、データソース管理者、またはIT/DevOps
備考
この文書は、コネクターの設定中に利用できるすべての構成フィールドについて論じています。 一部のフィールドは、設定の以前の手順で管理者によってすでに入力されている場合があり、表示されない場合があります。 Data Prepのコネクターフレームワークの詳細については、Data Prepコネクターのセットアップを参照してください。 また、管理者がこのコネクタにデータソースのリストで別の名前を付けている可能性があります。
Data Prepの設定¶
このコネクターを使用すると、インポートソースとしての AWS Athena に接続できます。データソースで設定する必要があるフィールドは、管理者が行ったコネクターの設定に応じて異なります。
一般¶
- 名前:UIでユーザーに表示されるデータソースの名前。
- 説明:UIでユーザーに表示されるデータソースの説明。
ヒント
Data Prepを複数のAWS Athenaインスタンスに接続できます。わかりやすい名前を使用すると、ユーザーが適切なデータソースを識別する上で非常に役立ちます。
Amazon Athenaの設定¶
- Athenaリージョン:AWSがホストする領域。
- アクセスキー:AWSアカウントのアクセス キー。
- シークレットキー:AWS アカウントのシークレットキー。
クエリ結果ストレージの設定¶
- S3バケット名:Athenaで クエリ結果を格納するS3バケットの名称。
- S3オブジェクトの接頭辞:Athena が指定されたS3バケット内にクエリ結果を格納する際に使用する接頭辞。接頭辞に関する詳細については、 S3 バケットでのフォルダーの使用方法 を参照してください。
- 暗号化タイプ:AWSサーバー側の暗号化の種類。
クエリ結果について¶
アテナを使用する場合、各クエリ結果は設定されたS3バケットに保存されます。Athena はこのように動作するように設計されており、これは想定される動作です。Athenaを使用してData Prepにインポートする場合、接続が閉じた場合はクエリー結果がデフォルトでクリーンアップされます。Athena のコネクターは、当該クエリ結果を保持するインスタンスが複数存在しないように、この削除タスクを実行するように設計されています。Data Prepへのインポートからのクエリー結果をS3で引き続き利用できるようにする場合は、Athenaスタンドアロンでクエリーを実行し、結果ファイルをS3からData Prepにインポートするだけです。
Webプロキシ設定¶
プロキシサーバーを介してAWSアテナに接続する場合、これらのフィールドは、プロキシの詳細を定義します。
- Webプロキシ:プロキシが不要な場合は「なし」、AWSAthenaへの接続をプロキシサーバー経由で行う必要がある場合は「プロキシ」。 Webプロキシサーバーが必要な場合、プロキシ接続を有効にするには以下のフィールドが必要です。
- プロキシホスト:Webプロキシ サーバーのホスト名またはIPアドレス。
- プロキシサーバー:データソースのプロキシサーバー上のポート。
- プロキシユーザー名:プロキシ サーバーのユーザー名。
- プロキシ パスワード:プロキシ サーバーのパスワード。
認証されていないプロキシ接続では、ユーザー名とパスワードを空白のままにします。
データインポート情報¶
ブラウジング経由¶
このコネクタではブラウジングがサポートされており、アテナクエリを使用してブラウジング可能な階層を生成します。Athenaのコスト構造については、以下の備考を参照してください。
SQLクエリー経由¶
詳細については、SQLリファレンスにアクセスしてください。
ベストプラクティス¶
Athena を使用するにあたっては、実行するクエリごとに課金がされます。発生する料金は、クエリが読み込むデータの量に基づきます。詳細については、 Amazon Athenaの価格設定を参照してください。