Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

連続値プロジェクトの予測間隔

本機能の提供について

連続値プロジェクトの予測間隔はデフォルトではオフになっています。この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。

機能フラグ:連続値プロジェクトでの予測間隔

予測間隔の概要

連続値問題に関する多くのユースケースの関心は、数値ターゲット特徴量の予測だけでなく、その予測の精度の定量化にもあります。

明日の平均気温yを予測する問題を考えてみます。この場合、今日の気象条件xを考慮に入れます。特定の日に、モデルで15℃の平均温度が予測されたとします。さらに追加で温度が14℃~16℃の間になるという予測も得られたとします。これは10℃から20℃の間の信頼性で15℃の温度を予測するよりもさらに有用な予想です。

上記の温度範囲([14、16]、および[10、20])は予測間隔と呼ばれます。予測間隔は常に信頼性確率pに関連付けられます。信頼性確率の一般的な値は0.8、0.9、または0.99です。確率の特定の選択は現在のユースケースに依存し、ビジネスにおける考慮事項に左右されます。

特定の確率pおよび関連付けられた予測間隔[L, U]において、ターゲットYの実際の観測値が[L, U](確率p)になると予測されます。この予測には、次のような頻繁な対応があります。特徴量分散Xからのランダムなサンプリング、Yの予測の計算、および予測間隔[L, U]の計算は、サンプルの100 pパーセント [ (L, U) ]になります。残りについては、100·(1-p) パーセントでは、実際の観測値Yは予測間隔[ (L、U) ]の外になります。

DataRobotは、コンフォーマル推論方法を使用して連続値プロジェクトの予測間隔を推測します。

MLOpsデプロイの予測間隔

DataRobot MLOpsにデプロイされた連続値モデルの予測は、予測区間で補完できます(オプション)。有効にした後、新規に作成されたすべての連続値モデルのデプロイでは、予測区間も生成されます。

予測間隔の設定は、MLOpsデプロイリストからデプロイを選択し、信頼性 >予測間隔タブに移動して表示および変更できます。

「予測間隔」タブの設定セクションでは、特徴量の有効化と無効化、推定方法の選択、および信頼度確率のセットの選択を行うことができます。DataRobotは、1つの予測間隔推定方法(「オンラインコンフォーマル」)をサポートします。

トランペットチャート

設定セクションの後に表示されるトランペットチャートは、ホールドアウトセットに対して計算された予測間隔の長さを視覚的に表示します(ホールドアウトが使用できない場合は同等のデータセットが表示されます)。ホールドアウトセットの中の各データポイントに対して、DataRobotは予測間隔と予測を計算します。次に、予測値を差し引くことにより、予測間隔が正規化されます。これにより、ゼロ付近の正規化された予測間隔が中心になります。 最後に、予測間隔は長さによって正規化されます。グラフのx軸はパーセンテージです。y軸は、正規化された予測間隔の長さです。

現在、オンラインコンフォーマル方式は、一定の長さの予測間隔を生成します。このため、このチャートには長方形が表示されています。


更新しました April 13, 2022
Back to top