Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

時系列プロジェクトのスコアリングコード

スコアリングコードは、DataRobotアプリケーションの外でDataRobotモデルを利用するための、ポータブルかつ低レイテンシーな手法です。 Javaベースのスコアリングコードパッケージの時系列モデルは、以下からエクスポートできます。

スコアリングコードをサポートする時系列ブループリント

通常、以下のブループリントはスコアリングコードをサポートしています。

  • AUTOARIMA with Fixed Error Terms
  • ElasticNet Regressor (L2 / Gamma Deviance) using Linearly Decaying Weights with Forecast Distance Modeling
  • ElasticNet Regressor (L2 / Gamma Deviance) with Forecast Distance Modeling
  • ElasticNet Regressor (L2 / Poisson Deviance) using Linearly Decaying Weights with Forecast Distance Modeling
  • ElasticNet Regressor (L2 / Poisson Deviance) with Forecast Distance Modeling
  • Eureqa Generalized Additive Model (250 Generations)
  • Eureqa Generalized Additive Model (250 Generations) (Gamma Loss)
  • Eureqa Generalized Additive Model (250 Generations) (Poisson Loss)
  • Eureqa Regressor (Quick Search: 250 Generations)
  • eXtreme Gradient Boosted Trees Regressor
  • eXtreme Gradient Boosted Trees Regressor (Gamma Loss)
  • eXtreme Gradient Boosted Trees Regressor (Poisson Loss)
  • eXtreme Gradient Boosted Trees Regressor with Early Stopping
  • eXtreme Gradient Boosted Trees Regressor with Early Stopping (Fast Feature Binning)
  • eXtreme Gradient Boosted Trees Regressor with Early Stopping (Gamma Loss)
  • eXtreme Gradient Boosted Trees Regressor with Early Stopping (learning rate =0.06) (Fast Feature Binning)
  • eXtreme Gradient Boosting on ElasticNet Predictions
  • eXtreme Gradient Boosting on ElasticNet Predictions (Poisson Loss)
  • Light Gradient Boosting on ElasticNet Predictions
  • Light Gradient Boosting on ElasticNet Predictions (Gamma Loss)
  • Light Gradient Boosting on ElasticNet Predictions (Poisson Loss)
  • Performance Clustered Elastic Net Regressor with Forecast Distance Modeling
  • Performance Clustered eXtreme Gradient Boosting on Elastic Net Predictions
  • RandomForest Regressor
  • Ridge Regressor using Linearly Decaying Weights with Forecast Distance Modeling
  • Ridge Regressor with Forecast Distance Modeling
  • Vector Autoregressive Model (VAR) with Fixed Error Terms
  • IsolationForest Anomaly Detection with Calibration (time series)
  • Anomaly Detection with Supervised Learning (XGB) and Calibration (time series)

上記のブループリントはスコアリングコードをサポートしていますが、スコアリングコードが利用できない状況もあります。

  • スコアリングコードは、特徴量探索を使用して生成された一部のモデルでは使用できない場合があります。
  • イベントがデータセットにない場合、日付レベル以外のカレンダーで整合性の問題が発生する可能性があります。そのため、スコアリングコードは利用できません。
  • ゼロ以外のブラインド履歴がある状況で予測ポイントを推論すると、整合性の問題が発生する可能性があります。ただし、この場合もスコアリングコードを利用できます。
  • MeCabトークナイザーを用いたテキストのトークン化を使用する一部のモデルでは、スコアリングコードが利用できない場合があります。
  • ローリング合計の計算が異なることで、重み付け特徴量を持つプロジェクトと、weighted stdまたはweighted meanを持つ特徴量セットでトレーニングされたモデルで整合性の問題が発生することがあります。
時系列のスコアリングコードで利用できる機能

現在、時系列のスコアリングコードでは以下の機能がサポートされています。

スコアリングコードでは次の時系列機能はまだサポートされていません。

  • 行ベース/不規則なデータ
  • ナウキャスティング(単一の予測ポイント)
  • 月内の季節性
  • 時系列アンサンブル
  • 自動拡張
  • EWMA(指数加重移動平均)

CLIスコアリングの時系列パラメーター

DataRobotでは、コマンドラインでのスコアリングの使用が可能です。 次の表では、時系列のパラメーターについて説明します。

フィールド 必須 デフォルト 説明
--forecast_point=<value> いいえ なし 予測を行うフォーマットされた日付。
--date_format=<value> いいえ なし 出力に使用する日付形式。
--predictions_start_date=<value> いいえ なし 予測の計算の開始タイミングを示すタイムスタンプ。
--predictions_end_date=<value> いいえ なし 予測の計算の終了タイミングを示すタイムスタンプ。
--with_intervals いいえ なし 予測区間の計算をオンにします。
--interval_length=<value> いいえ なし 1から99までのint値としての間隔の長さ。
--time_series_batch_processing いいえ 無効 時系列モデルのパフォーマンスを最適化したバッチ処理を可能にします。

セグメント化されたモデリングプロジェクトのスコアリングコード

セグメントモデリングでは、複数系列プロジェクトのセグメントに対して個別のモデルを構築することができます。 そして、DataRobotはこれらのモデルを統合し、統合モデルを作成します。

備考

スコアリングコードのサポートは、クラスタリングモデルによって検出されたセグメントではなく、データセットのID列で定義されたセグメントに対して有効です。

セグメントモデルにスコアリングコードがあることを確認します

セグメントのチャンピオンモデルにスコアリングコードがない場合は、スコアリングコードがあるモデルを選択します。

  1. リーダーボードの結合モデルに移動します。

  2. セグメントドロップダウンメニューから、セグメントを選択します。 セグメントのチャンピオンを見つけます(セグメントチャンピオンインジケーターで指定)。

  3. セグメントチャンピオンにスコアリングコードインジケーターがない場合は、モデリング要件を満たし、スコアリングコードインジケーターがある新規モデルを選択します。 次に、上部のメニューからリーダーボードオプション > モデルをチャンピオンにするを選択します。

    セグメントには、スコアリングコードを持つセグメントチャンピオンが表示されます。

  4. 結合モデルの各セグメントに対してこのプロセスを繰り返し、すべてのセグメントチャンピオンがスコアリングコードを持っていることを確認します。

結合モデルのスコアリングコードのダウンロード

結合モデルのスコアリングコードJARをダウンロードするには:

スコアリングコードの予測区間

時系列モデルのダウンロード済みスコアリングコードJARに予測区間を含めることができるようになりました。 サポート間隔は1~99です。

予測区間を含むスコアリングコードのダウンロード

予測間隔を有効にしてスコアリングコードJARをダウンロードするには:

予測区間を使用したCLIの例

以下は、予測区間を使用してモデルをスコアリングするCLIの例です。

java -jar model.jar csv \
    --input=syph.csv \
    --output=output.csv \
    --with_intervals \
    --interval_length=87 

更新しました February 6, 2024