Data Prep用のData Prepコネクターのセットアップ¶
Data Prepコネクターとは?¶
すべてのData Prepストーリーは、コネクターで始まり、コネクターで終わります。データの準備ができることは、準備に必要なデータを取得し、準備後に必要な場所にそのデータを送信できる場合にのみ価値があります。Data Prepコネクターは、Data Prepとの間でデータを送受信するためのツールです。
Data Prepコネクターの利点¶
ビジネスユーザーのための簡単なデータアクセス¶
異種システム上のデータへのアクセスは、コーダーにとってそれほど複雑ではありません。ほとんどのデータベース、ファイルストア、およびWebサービスには、業界標準に準拠した、十分に開発されたコードフレンドリーなインターフェイスがあります。
コーディングをしないユーザーにとってデータのインテグレーションは難しいものです。¶
DataRobotはこの問題に取り組み、DataRobot Data Prepのノンコーディングユーザーに可能な限り多くのデータソースを開放しました。当社の目標は、ビジネスアナリスト(ノンコーディングユーザー)が、使用を許可されている組織内の任意のデータにアクセスできるようにすることです。
ブラウジングとクエリーの比較¶
ノンコーディングユーザーを有効にするための核心的な側面の一つは、ブラウジングインターフェイスです。他のデータ準備またはETLソリューションがSQLクエリーに依存している場合、Data Prep内のすべてのデータソースを参照し、クリックするだけでデータをインポートできます。
コントロールとガバナンス¶
ビジネス環境は、通常のITインフラが対応するよりもはるかに流動的ですが、それでも、特定の人は特定の情報にしかアクセスできず、その情報を特定の場所にしか送れないようにすべきです。コネクターフレームワークを使用すると、大規模で複雑な組織は、ユーザーが自分に付与された情報にのみアクセスできるようにし、速度とセルフサービスが優先される小規模な組織向けに簡単に設定できます。
Data Prep コネクターのセットアップ¶
3層の設定¶
コネクターを設定する際には、上位から下位に向かって、それぞれ「コネクター」、「データソース」、「セッション」の3つの階層レベルがあります。フィールドが上位レベルで入力されている場合、下流で再度入力する必要はありません。一部のフィールドは後の段階で変更できる場合がありますが、それはコネクターによって大きく異なります。
コネクター設定¶
このレベルは通常、管理者やITによって作成、管理され、以下の目的のために存在します。
- 特定のユーザーグループが特定のコネクターを利用できるようにします。
- 管理者が、ユーザーが知らない情報や、コネクター設定に依存するすべてのユーザー/データソースで同じ情報を入力できるようにします。
- また、管理者は、SSHキーなど、アクセス権を持たないユーザーから機密情報を保護することができます。
データソース設定¶
このレベルは、ソースシステムデータへのアクセスがどのように管理されているかに応じて、通常、個々のユーザーまたは管理者のいずれかによって作成・管理され、次の目的で存在します。
- コネクター設定レベルでまだキャプチャされていないすべての永続的な設定を含みます。
- 通常これには、共有データソース設定の実行時に指定されるユーザー資格情報を除くすべてが含まれます。
セッション設定¶
このレベルは、ほとんどが個々のユーザーによって独占的に管理されているか、不要な場合は無視され、次の目的で存在します。
- インポート/エクスポートの実行時に情報をキャプチャします。
- 通常、これはユーザーの資格情報に限定されます。
コントロールの共有¶
- コネクターとデータソースの設定は、テナント内のグループと共有できます。
- これらの共有コントロールを使用すると、指定したグループのメンバーが設定を読み取り、更新、または削除できるかどうか、およびユーザーが設定を使用してインポートやエクスポートを実行できるかどうかを指定することもできます。
セットアップの例¶
以下は、ビジネスの状況と、各チームのニーズに合わせてコネクターフレームワークをどのように設定するかに関する例です。
例1:¶
ビジネスの状況¶
「SSH Key with Passphrase」によって認証されたIT管理のSFTPサーバー。キーとパスフレーズはIT部門によって保持され、複数のチームが異なるディレクトリにアクセスする必要があります。
セットアップ¶
- コネクター設定
- IT部門は1つのコネクター設定を作成し、SFTPホストとポート、SSHキーとパスフレーズを入力します。
- 共有:なし
- データソース設定
- チームごとに新しいデータソースを作成し、適切なルートディレクトリを指定します。
- 共有:完全に設定された各データソースを、対応するチームと読み取り専用で共有し、必要に応じてインポートやエクスポートを許可します。
- セッション設定
- N/A
このアプローチの利点¶
- 資格情報が変更された場合でも、1か所で管理するだけで済みます。
- IT部門は資格情報を管理し、ユーザーから非公開にすることができます。
- 各チームは、データソース自体のアクセス制御を管理しなくても、必要なアクセス権を持っています。
例2¶
ビジネスの状況¶
管理者が管理するSalesforce組織では、各ユーザーはSalesforceで権限を持つ情報のみにアクセスする必要があり、各ユーザーはData Prep内で自動化ジョブを実行する必要があります。
セットアップ¶
- コネクター設定
- Salesforce管理者は、1つのコネクター設定を作成し、ユーザーとパスワードを除くすべての関連情報を入力します。
- 共有:この設定と関連する各グループと読み取り専用で共有します。
- データソース設定
- 各ユーザーは、独自のデータソース設定を作成し、資格情報のみを入力して、セットアップを維持し、自動化ジョブで使用できるようにする必要があります。
- 共有:なし
- セッション設定
- N/A
このアプローチの利点¶
- 管理者レベルのセットアップは管理者が行い、各ユーザーはユーザー名とパスワード、すぐに利用できる情報だけを入力する必要があります。
- 各ユーザーの認証はSalesforceで管理されます。