Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

大規模なデータセットの予測

ファイルサイズ制限は予測方法によって異なります。大規模なデータセットの予測には、バッチ予測APIまたはリアルタイム予測APIを使用します。

次の例に、バッチ予測APIを使用して大規模データセットの予測を作成する方法を示します。リアルタイム予測に関する予測APIを参照してください。

この例では、予測データセットはAIカタログに保存されます。バッチ予測APIは、他の場所からのデータでの予測もサポートします。AIカタログからのデータセットでの予測では、データセットのスナップショットを取得する必要がある点に注意してください。

バッチ予測APIを使用するには、すべてのAPIリクエストのヘッダーで送信されるAPIキーに加えて、次のものが必要です。

  1. <deployment_id>: 予測を作成するために使用するモデルのデプロイID。
  2. <dataset_id>: モデル<deployment_id>で使用されるスナップショット取得済みAIカタログデータセットのデータセットID。

以下の手順は、batchPredictions APIエンドポイントを使用して100MB以上のファイルで作業する方法を示します。これは手順の要約です。

  1. デプロイ済みモデルおよび使用するデータセットを示すBatchPredictionジョブを作成します。
  2. そのBatchPredictionジョブのステータスを完了まで確認します。
  3. 結果をダウンロードします。

1. バッチ予測ジョブを作成する

POST https://app.datarobot.com/api/v2/batchPredictions

リクエストの例:

{
    "deploymentId": "<deployment_id>",
    "intakeSettings": {
        "type": "dataset",
        "datasetId": "<dataset_id>"
    }
}

サンプルの時系列リクエスト(時系列プロジェクトおよび早期リリースの「時系列に対するバッチ予測」設定を有効にする必要があります):

{
    "deploymentId": "<deployment_id>",
    "intakeSettings": {
        "type": "dataset",
        "datasetId": "<dataset_id>"
    }、
    "timeseriesSettings": {
        "type": "forecast"
    }
}

応答の例:

応答のlinks.selfプロパティには、次の2つの手順で使用するURLが含まれています。

{
 "status": "INITIALIZING",
    "skippedRows": 0,
    "failedRows": 0,
    "elapsedTimeSec": 0,
    "logs": [
        "Job created by user@example.com from 10.1.2.1 at 2020-02-19 22:41:00.865000"
    ],
    "links": {
        "download": null,
        "self": "https://app.datarobot.com/api/v2/batchPredictions/a1b2c3d4x5y6z7/"
    },
    "jobIntakeSize": null,
    "scoredRows": 0,
    "jobOutputSize": null,
    "jobSpec": {
        "includeProbabilitiesClasses": [],
        "maxExplanations": 0,
        "predictionWarningEnabled": null,
        "numConcurrent": 4,
        "thresholdHigh": null,
        "passthroughColumnsSet": null,
        "csvSettings": {
            "quotechar": "\"",
            "delimiter": ",",
            "encoding": "utf-8"
        },
        "thresholdLow": null,
        "outputSettings": {
            "type": "localFile"
        },
        "includeProbabilities": true,
        "columnNamesRemapping": {},
        "deploymentId": "<deployment_id>",
        "abortOnError": true,
        "intakeSettings": {
            "type": "dataset",
            "datasetId": "<dataset_id>"
        },
        "includePredictionStatus": false,
        "skipDriftTracking": false,
        "passthroughColumns": null
    },
    "statusDetails": "Job created by user@example.com from 10.1.2.1 at 2020-02-19   22:41:00.865000",
    "percentageCompleted": 0.0
}

links.selfプロパティは、https://app.datarobot.com/api/v2/batchPredictions/a1b2c3d4x5y6z7/以下の手順2のGET呼び出しの<batch_prediction_job_status_url>特徴量です。

2. バッチ予測ジョブのステータスを確認します

GET <batch_prediction_job_status_url>

応答の例:

{
    "status": "INITIALIZING",
    "skippedRows": 0,
    "failedRows": 0,
    "elapsedTimeSec": 352,
    "logs": [
        "Job created by user@example.com from 10.1.2.1 at 2020-02-19 22:41:00.865000",
        "Job started processing at 2020-02-19 22:41:16.192000"
    ],
    "links": {
        "download": "https://app.datarobot.com/api/v2/batchPredictions/a1b2c3d4x5y6z7/download/",
        "self": "https://app.datarobot.com/api/v2/batchPredictions/a1b2c3d4x5y6z7/"
    },
    "jobIntakeSize": null,
    "scoredRows": 1982300,
    "jobOutputSize": null,
    "jobSpec": {
        "includeProbabilitiesClasses": [],
        "maxExplanations": 0,
        "predictionWarningEnabled": null,
        "numConcurrent": 4,
        "thresholdHigh": null,
        "passthroughColumnsSet": null,
        "csvSettings": {
            "quotechar": "\"",
            "delimiter": ",",
            "encoding": "utf-8"
        },
        "thresholdLow": null,
        "outputSettings": {
            "type": "localFile"
        },
        "includeProbabilities": true,
        "columnNamesRemapping": {},
        "deploymentId": "<deployment_id>",
        "abortOnError": true,
        "intakeSettings": {
            "type": "dataset",
            "datasetId": "<dataset_id>"
        },
        "includePredictionStatus": false,
        "skipDriftTracking": false,
        "passthroughColumns": null
    },
    "statusDetails": "Job started processing at 2020-02-19 22:41:16.192000",
    "percentageCompleted": 0.0
}

links.downloadプロパティは、https://app.datarobot.com/api/v2/batchPredictions/a1b2c3d4x5y6z7/download/以下の手順3のGET呼び出しの特徴量<batch_prediction_job_download_url>です。

3. バッチ予測ジョブの結果をダウンロードします

ジョブのステータスがエラーなしでCOMPLETED(完了)になるまで上記のステータスURLのポーリングを続けます。ジョブが完了したら、予測をダウンロードできます。

GET <batch_prediction_job_download_url>


更新しました April 15, 2022
Back to top