エンタープライズ・データベースのインテグレーション¶
注意
エンタープライズデータベースのインテグレーションは、リリースv7.3(クラウドユーザーは2021年12月13日)から使用できなくなり、完全に使用非推奨されます(寿命終了)。廃止後は、インテグレーションを使ってデプロイでの予測を生成することはできません。
さまざまなエンタープライズデータベースとのインテグレーションを有効にするために、DataRobotでは、データベースに予測を書き込むための「セルフサービス」プラットフォームが提供されています。この機能を使用すると、予測を作成するデータソースの選択、データをスコアリングするスケジュールの定義、および予測の結果の受信をすべてDataRobotデプロイから行うことができます。
DataRobotは、Microsoft SQL、Snowflake、Tableau、およびQlikの予測インテグレーションをサポートしています。
備考
モデリングプロジェクトが関連付けられていないデプロイを使用するMLOpsのみのインスタンスのユーザーに対して、予測インテグレーションジョブを設定できないことに備考してください。この場合、代わりにJDBCアダプターを使用してバッチ予測を行うことができます。
備考
予測統合ジョブは、デプロイメントオーナーのみが設定できます。
設定した予測ジョブは、すべて予測ジョブリストに表示されます。入力データのスキーマがデプロイの作成に使用されたデータと一致する場合、使用されるプラットフォームに関係なく、デプロイごとに複数のジョブを作成できます。
エンタープライズデータベースによる予測¶
データソースを使用して、Microsoft SQL、Snowflake、およびTableauデータベースに予測を書き込むことができます。デプロイの予測 > インテグレーションタブから、予測を書き込むデータベースのタイルを選択します。
-
予測値を取得したいデータソースを選択します。 または、プラスアイコン(+)を選択して、使用するAIカタログエントリとしてデータソースを追加します。
-
選択したら、データベースへのアクセスに使用するアカウント資格情報を選択します。保存した資格情報を使用しない場合は、別のアカウントを使用を選択し、新しい資格情報を入力してデータソースにアクセスします。データソースとアカウントを選択したら、次へをクリックします。
-
該当するチェックボックスを選択します。
-
予測の説明。各出力に対して返す説明の数を指定できます。
-
予測誤差。誤差は、予測応答の
prediction_status
列に返されます。
-
-
ターゲットの特徴量を選択します。これらは、データソースの列です。データソースの列を選択すると、予測と一緒にターゲットに書き込まれます。ターゲットはDataRobotから返されるテーブルです。このテーブルには、予測、予測の説明、ターゲット特徴量が含まれます。含める特徴量を[使用可能な特徴量]列でクリックするか、[すべて選択]を選択してすべての特徴量を含めます。次に、右向きの矢印をクリックして、選択した特徴量をターゲット特徴量として追加します。特徴量を削除するには、[選択された出力の特徴量]列で特徴量を選択し、左向きの矢印をクリックします。
選択されたターゲット特徴量のうち、1つの特徴量(各行にユニーク数のIDを含む特徴量)がプライマリーキーとして機能し、予測結果が返されます。ソースデータには、プライマリーキー機能とそれに対応するユニーク数なIDが含まれていなければならず、そうすることで予測結果とソースデータを照合して比較することができます。これを実現するには、データベースプラットフォームでjoinステートメントを使用します。
-
予測のターゲットを選択します。
-
Microsoft SQLおよびSnowflakeデータベースの場合:
データ保存先を新規にするか既存にするか、また、データソースに提供されているものと同じ資格情報を使用するか新しいアカウントを使用するかを選択します。
次のフィールドに入力します。
フィールド 説明 ユーザー名とパスワード 宛先に接続するために必要な資格情報を入力します。今後使用するために資格情報を保存するには、チェックボックスを選択します。 アカウント名 今後のログイン用に保存しておいた資格情報を表す名前を選択します。資格情報とアカウント名を入力後、保存してサインインをクリックします。 スキーマ データソースとして使用するスキーマの名前を入力します。選択すると、スキーマのデータベースがスキーマ名の下に表示されます。先に進む前に、データベースがデータ接続用に設定されていることを確認してください。 宛先のテーブル名 ドロップダウンからテーブルを選択して、予測と関連付けられたメタデータを含めます。または、ドロップダウンで新規テーブルを作成を選択し、使用するテーブルの名前を入力します。 -
Tableauの場合:
フィールド 説明 Tableau URL データソースの接続先となるサーバーのURLを入力します。 ユーザー名とパスワード Tableauサーバーへのアクセスに必要な資格情報を入力します。 サイト名 Tableauサーバー内で接続する特定のサイトの名前を指定します。ホストされたサーバーに接続する場合、このフィールドは空欄にしておきます。これらのサーバーは「デフォルト」サイトを使用します。これらのサーバーでは「デフォルト」サイトが使用されます。クラウドベースのTableauサーバーに接続する場合は、「デフォルト」サイトはありませんので、特定のサイト名を指定する必要があります。
すべてのフィールドへの入力が完了したら、次へをクリックします。続行する前に、データ接続が正常であることがDataRobotはテストされます。
-
-
予測ジョブを実行するときと方法を定義します。
-
予測ジョブに名前を付けます。
-
統合を自動的に実行するかどうかを選択します。オンに切り替えた場合、ジョブを実行するスケジュールをドロップダウンから選択できます(毎時、毎日、毎週など)。無効にすると、ジョブ設定が保存されます。保存されたジョブは、予測ジョブページから手動で実行します。
-
-
設定が完了したら、終了をクリックします。これでジョブが完全に設定されました。ジョブ実行履歴、追加のメタデータ、およびジョブリストは、デプロイのインテグレーションタブに表示できます。
Qlik予測¶
DataRobotは、スコアリング用にQlikデータを送信するために必要なコマンドと識別子を含むコードスニペットを提供します。このコードは予測APIとともに使用することができます。
デプロイの予測 > インテグレーションタブからQlikタイルを選択します。
Qlikコードスニペットを使用するには、サンプルに従い、APIを介してモデルを運用アプリケーションに統合する場合は必要な変更を加えます。チェックボックスを選択して、予測結果に予測の説明(1)を含めます。
サンプルコードをコピーし(2)、必要に応じて修正します。変更した後、スニペットは予測APIで使用できるようになります。
予測ジョブの表示¶
デプロイインベントリでは、すべてのデプロイに対して設定された予測インテグレーションジョブのリストを表示できます。デプロイ > 予測ジョブに移動します。なお、ジョブごとの履歴やデプロイごとの履歴も表示できます。
予測ジョブリストに表示される情報およびアクションを以下の表に示します。
カテゴリ | 説明 |
---|---|
ジョブ名 | デプロイに対して設定された予測統合ジョブの名前。 |
最後に成功した実行 | 予測ジョブの最後の正常な予測応答について記録された日時。 |
最後に失敗した実行 | 予測ジョブの失敗した最後の予測応答について記録された日時。 |
インテグレーションタイプ | デプロイが予測を書き込むデータベースプラットフォーム。 |
スケジュール | 予測ジョブを実行する間隔(月次、週次、日次など)。ジョブを手動で実行するように指定している場合、「無効」のステータスが返されます。ジョブのスケジュールを編集するには、鉛筆アイコンをクリックします。 |
ステータス | 各予測ジョブの現在のステータス。それぞれのステータスの詳細については、以下をご覧ください。 |
削除 | 特定の予測ジョブを削除するには、この列のごみ箱アイコンを選択します。 |
ステータスインジケーター¶
ステータスサマリー(予測ジョブリスト内)には、各予測ジョブの状態が一目でわかる情報が表示されます。予測ジョブのより詳細な情報を見るには、そのジョブをクリックしてジョブ実行履歴を開きます。
各予測ジョブの色インジケーターの意味を以下に示します。
色 | ステータス |
---|---|
![]() |
最後の予測ジョブが正常に実行されました。 |
![]() |
最後の予測ジョブが失敗しました。 |
![]() ![]() |
予測ジョブが進行中です。ジョブの実行履歴を表示すると、代わりに砂時計のアイコンが表示されます。 |
![]() |
予測ジョブはまだ実行されていません。 |
ジョブ履歴¶
予測リクエストの履歴を表示するには、予測ジョブリストから目的の予測ジョブを選択します。個々のジョブ履歴にはデプロイのインテグレーションタブからアクセスすることもできます。
ジョブ履歴の詳細:
- 各ジョブの開始時間と終了時間
- 各ジョブの実行にかかった秒数
- スコアリングされた行の数
- 失敗した行の数
- ジョブの状態
各ジョブの記録された進捗状況を表示するには、ログを表示の下にある下のドロップダウンをクリックします。これは、失敗した予測ジョブの実行のトラブルシューティングを行い、失敗の原因となった特定のエラーを識別するのに役立ちます。
ジョブリスト¶
単一のデプロイ用に設定されたすべての予測ジョブを表示するには、そのデプロイのインテグレーションタブに移動します。すべての既存のジョブがタイルの下に表示されます。
デプロイ固有のジョブリストの詳細:
- 使用されるデータソースを表すアイコン付きのジョブ名
- ジョブが作成されたとき
- 最後の実行の日付/時刻
- ジョブの状態
- ジョブスケジュール
- ジョブアクション(ジョブの実行の一時停止/再開、または既存のジョブの削除)