Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

Databricks

The Databricks connector allows you to access data in Databricks on Azure or AWS.

サポート対象の認証

  • パーソナルアクセストークン
  • サービスプリンシパル

前提条件

In addition to either a personal access token or service principal for authentication, the following is required before connecting to Databricks in DataRobot:

パーソナルアクセストークンの生成

Azure Portalアプリで、Databricksワークスペースのパーソナルアクセストークンを生成します。 このトークンは、DataRobotのDatabricksへの接続の認証に使用されます。

詳細については、Azure Databricksドキュメントを参照してください。

AWSで、Databricksワークスペースのパーソナルアクセストークンを生成します。 このトークンは、DataRobotのDatabricksへの接続の認証に使用されます。

AWSでのDatabricksドキュメントを参照してください。

Create a service principal

In the Azure Portal app, create an service principal for your Databricks workspace. The resulting client ID and client secret will be used to authenticate your connection to Databricks in DataRobot.

詳細については、Azure Databricksドキュメントを参照してください。 In the linked instructions, copy the following information:

  • Application ID:Entered in the client ID field during setup in DataRobot.
  • OAuth secrets:Entered in the client secret field during setup in DataRobot.

Make sure the service principal has permission to access the data you want to use.

In AWS, create an service principal for your Databricks workspace. The resulting client ID and client secret will be used to authenticate your connection to Databricks in DataRobot.

詳細については、Azure Databricksドキュメントを参照してください。

Make sure the service principal has permission to access the data you want to use.

DataRobotでの接続の設定

DataRobotでDatabricksに接続するには(この例はAzureを使用することに注意してください):

  1. ワークベンチを開き、ユースケースを選択します。
  2. データソースに接続する手順に従ってください。
  3. 前のセクションで取得した情報を使用して、 必要な設定パラメーターを入力します。

  4. 認証で、新しい資格情報をクリックします。 次に、アクセストークンと一意の表示名を入力します。 このデータソースへの資格情報をすでに追加している場合は、保存済みの資格情報から資格情報を選択できます。

    If you selected service principal as the authentication method, enter the client ID, client secret, and a unique display name.

  5. 保存をクリックします。

必須パラメーター

以下の表は、Databricksとの接続を確立するために最低限必要なフィールドの一覧です。

必須フィールド 説明 ドキュメンテーション
サーバーのホスト名 接続先のサーバーのアドレス。 Azure Databricksドキュメント
HTTP Path コンピューティングリソースのURL。 Azure Databricksドキュメント
必須フィールド 説明 ドキュメンテーション
サーバーのホスト名 接続先のサーバーのアドレス。 AWSでのDatabricksドキュメント
HTTP Path コンピューティングリソースのURL。 AWSでのDatabricksドキュメント

SQLウェアハウスはSQLの実行専用であるため、その結果としてクラスターよりもオーバーヘッドが少なく、多くの場合はパフォーマンスが向上します。 可能な場合は、SQLウェアハウスを使用することをお勧めします。

備考

接続設定でcatalogパラメーターが指定されている場合、ワークベンチにはそのカタログのスキーマのリストのみが表示されます。 このパラメーターを指定しないと、アクセスできるすべてのカタログがワークベンチに一覧表示されます。

トラブルシューティング

問題 解決方法 説明
DataRobotで操作を実行しようとすると、ファイアウォールが毎回IPアドレスをクリアするよう要求します。 DataRobotのホワイトリストに登録されたすべてのIPを追加します。 ホワイトリストの送信元IPアドレスを参照してください。 ホワイトリストに登録されたIPをすでに追加している場合は、既存のIPが完全であることを確認してください。

機能に関する注意事項

ネイティブDatabricksコネクターを使用した予測はできません。 JDBCドライバーを使用してDatabricksに接続する必要があります。


更新しました April 8, 2024