Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

予測を作成

DataRobot内にデプロイされた機械学習(ML)モデルに対してスコアリングする必要のあるデータがある場合、Data Prep予測ツールでスコアを生成します。

予測ツールの操作

予測ツールにアクセスするには、ツールバーのDataRobotアイコンをクリックし、予測を選択します。

スコアを生成するために、DataRobot APIトークンを提供します。これは、DataRobotデプロイメントリストを取得するために使用されます。

備考

トークンを取得するには、ユーザー設定 > 開発者ツール > APIキーに移動します。

次に、デプロイメントを選択します。あなたのデータは、このデプロイメントでモデルに対してスコアリングされます。スコアリングに使用するモデルが時系列モデルの場合、時系列モデルチェックボックスチェックを選択して、これを指定する必要があります。次に、オプションタブで予測ポイント指定し、任意で系列IDを指定します。詳しくはオプションをご覧ください。

備考

カスタムモデルのデプロイメントは現在サポートされていません。

デフォルトでは、データセットに予測スコアの新しい列が「目標」として作成されます。この名前を変更するには、オプションタブをクリックし、予測列フィールドに別の名前を入力します。

デプロイメントを選択すると、予測が実行されます。新しい列が作成され、予測スコアが提供されます。さらに、「目標予測値」列も生成され、各スコアに関連する予測値を提供します。マルチクラス予測の場合、予測値は分類ごとに返されます。例えば、画像を"apple"、"orange"、"pear"に分類した場合、さらに3つの列が返され、それぞれの対応するスコアに1つの値があります。

ユースケース予測値の例

  • 病院の患者が退院後に再入院する確率を予測します。予測列には、患者が再入院する可能性が高いか、再入院しないかを示す1または0のバイナリ値が格納されます。

  • 画像の集合をオレンジ、梨、リンゴ3つの果物のいずれかに分類します。予測列には、オレンジ、梨、リンゴの3つの値のいずれかが入ります。

  • 予測日に基づいて売上を予測します。この場合の予測列には、売上のドル換算額が入ります。

バイナリおよび時系列予測デプロイの場合、オプションタブが追加オプションを提供します。詳しくはオプションをご覧ください。

オプション

時系列予測では、予測ポイントも提供する必要があります。予測ポイントは、予測の作成元となるポイント、つまり「もし今現在だったら」の相対時間です。DataRobotでは、トレーニングデータのすべての潜在的予測ポイントを使用してモデルをトレーニングします。運用環境では、これは一般的に直近の時間です。

重要

この日付のフォーマットは、ISO 2014-08-12T00:00:00Zでなければなりません。

オプションとして、データセットに複数の時系列データが含まれている場合、例えば、複数の店舗の売上を予測するための複数の時系列データが含まれている場合、シリーズIDとして列を指定することで、データをグループ化し、グループごとに別々に予測値を返すことができます。

二値予測の場合、オプションタブは、予測が返された理由の理解に役立つ予測の説明を提供します。例えば、「この患者が再入院する可能性のスコアが1である理由」などです。または、「なぜこの画像はリンゴと認識したのでしょうか?」などです。

説明を有効にすると、プロジェクトの説明ごとに5つの新しい列が生成されます。

  • 特徴量:予測に貢献する特徴量の名前。

  • 特徴量値:この行に対して特徴量が取った値。

  • :この特徴量の値が予測に影響した量。

  • 定性:特徴量が予測に影響した強度を示す人間が読み取ることのできる説明。例えば、以下のようになります。++++; -; +

  • ラベル:この予測の説明から派生した出力を説明します。連続値プロジェクトの場合、これはターゲット特徴量の名前です。分類プロジェクトでは、その確率が高まれば、この予測説明の正の強さに対応することになるクラスのことです。

さらに、閾値の低い値と高い値を設定することで、閾値を超えたスコアに対してのみ説明を生成することができます。

予測値として返される値の詳細については、予測説明を参照してください。


更新しました February 22, 2022
Back to top