時系列プロジェクトのスコアリングコード¶
スコアリングコードは、DataRobotアプリケーションの外でDataRobotモデルを利用するための、ポータブルかつ低レイテンシーな手法です。 Javaベースのスコアリングコードパッケージの時系列モデルは、以下からエクスポートできます。
スコアリングコードをサポートする時系列ブループリント
通常、以下のブループリントはスコアリングコードをサポートしています。
- AUTOARIMA with Fixed Error Terms
- ElasticNet Regressor (L2 / Gamma Deviance) using Linearly Decaying Weights with Forecast Distance Modeling
- ElasticNet Regressor (L2 / Gamma Deviance) with Forecast Distance Modeling
- ElasticNet Regressor (L2 / Poisson Deviance) using Linearly Decaying Weights with Forecast Distance Modeling
- ElasticNet Regressor (L2 / Poisson Deviance) with Forecast Distance Modeling
- Eureqa Generalized Additive Model (250 Generations)
- Eureqa Generalized Additive Model (250 Generations) (Gamma Loss)
- Eureqa Generalized Additive Model (250 Generations) (Poisson Loss)
- Eureqa Regressor (Quick Search: 250 Generations)
- eXtreme Gradient Boosted Trees Regressor
- eXtreme Gradient Boosted Trees Regressor (Gamma Loss)
- eXtreme Gradient Boosted Trees Regressor (Poisson Loss)
- eXtreme Gradient Boosted Trees Regressor with Early Stopping
- eXtreme Gradient Boosted Trees Regressor with Early Stopping (Fast Feature Binning)
- eXtreme Gradient Boosted Trees Regressor with Early Stopping (Gamma Loss)
- eXtreme Gradient Boosted Trees Regressor with Early Stopping (learning rate =0.06) (Fast Feature Binning)
- eXtreme Gradient Boosting on ElasticNet Predictions
- eXtreme Gradient Boosting on ElasticNet Predictions (Poisson Loss)
- Light Gradient Boosting on ElasticNet Predictions
- Light Gradient Boosting on ElasticNet Predictions (Gamma Loss)
- Light Gradient Boosting on ElasticNet Predictions (Poisson Loss)
- Performance Clustered Elastic Net Regressor with Forecast Distance Modeling
- Performance Clustered eXtreme Gradient Boosting on Elastic Net Predictions
- RandomForest Regressor
- Ridge Regressor using Linearly Decaying Weights with Forecast Distance Modeling
- Ridge Regressor with Forecast Distance Modeling
- Vector Autoregressive Model (VAR) with Fixed Error Terms
- IsolationForest Anomaly Detection with Calibration (time series)
- Anomaly Detection with Supervised Learning (XGB) and Calibration (time series)
上記のブループリントはスコアリングコードをサポートしていますが、スコアリングコードが利用できない状況もあります。
- スコアリングコードは、特徴量探索を使用して生成された一部のモデルでは使用できない場合があります。
- イベントがデータセットにない場合、日付レベル以外のカレンダーで整合性の問題が発生する可能性があります。そのため、スコアリングコードは利用できません。
- ゼロ以外のブラインド履歴がある状況で予測ポイントを推論すると、整合性の問題が発生する可能性があります。ただし、この場合もスコアリングコードを利用できます。
- MeCabトークナイザーを用いたテキストのトークン化を使用する一部のモデルでは、スコアリングコードが利用できない場合があります。
- ローリング合計の計算が異なることで、重み付け特徴量を持つプロジェクトと、
weighted std
またはweighted mean
を持つ特徴量セットでトレーニングされたモデルで整合性の問題が発生することがあります。
時系列のスコアリングコードで利用できる機能
現在、時系列のスコアリングコードでは以下の機能がサポートされています。
- コマンドラインでのスコアリング用の時系列パラメーター。
- セグメント化されたモデリング
- 予測の説明
- カレンダー(高解像度)
- 交差系列
- ゼロ過剰/ナイーブ二値
- ナウキャスティング(履歴範囲予測)
- ブラインド履歴ギャップ
- 加重特徴量
スコアリングコードでは次の時系列機能はまだサポートされていません。
- 行ベース/不規則なデータ
- ナウキャスティング(単一の予測ポイント)
- 月内の季節性
- 時系列アンサンブル
- 自動拡張
- EWMA(指数加重移動平均)
CLIスコアリングの時系列パラメーター¶
DataRobotでは、コマンドラインでのスコアリングの使用が可能です。 次の表では、時系列のパラメーターについて説明します。
フィールド | 必須 | デフォルト | 説明 |
---|---|---|---|
--forecast_point=<value> |
いいえ | なし | 予測を行うフォーマットされた日付。 |
--date_format=<value> |
いいえ | なし | 出力に使用する日付形式。 |
--predictions_start_date=<value> |
いいえ | なし | 予測の計算の開始タイミングを示すタイムスタンプ。 |
--predictions_end_date=<value> |
いいえ | なし | 予測の計算の終了タイミングを示すタイムスタンプ。 |
--with_intervals |
いいえ | なし | 予測区間の計算をオンにします。 |
--interval_length=<value> |
いいえ | なし | 1から99までのint 値としての間隔の長さ。 |
--time_series_batch_processing |
いいえ | 無効 | 時系列モデルのパフォーマンスを最適化したバッチ処理を可能にします。 |
セグメント化されたモデリングプロジェクトのスコアリングコード¶
セグメントモデリングでは、複数系列プロジェクトのセグメントに対して個別のモデルを構築することができます。 そして、DataRobotはこれらのモデルを統合し、統合モデルを作成します。
備考
スコアリングコードのサポートは、クラスタリングモデルによって検出されたセグメントではなく、データセットのID列で定義されたセグメントに対して有効です。
セグメントモデルにスコアリングコードがあることを確認します¶
セグメントのチャンピオンモデルにスコアリングコードがない場合は、スコアリングコードがあるモデルを選択します。
-
リーダーボードの結合モデルに移動します。
-
セグメントドロップダウンメニューから、セグメントを選択します。 セグメントのチャンピオンを見つけます(セグメントチャンピオンインジケーターで指定)。
-
セグメントチャンピオンにスコアリングコードインジケーターがない場合は、モデリング要件を満たし、スコアリングコードインジケーターがある新規モデルを選択します。 次に、上部のメニューからリーダーボードオプション > モデルをチャンピオンにするを選択します。
セグメントには、スコアリングコードを持つセグメントチャンピオンが表示されます。
-
結合モデルの各セグメントに対してこのプロセスを繰り返し、すべてのセグメントチャンピオンがスコアリングコードを持っていることを確認します。
結合モデルのスコアリングコードのダウンロード¶
結合モデルのスコアリングコードJARをダウンロードするには:
-
リーダーボードから:統合されたモデルからスコアリングコードをダウンロードします。
-
デプロイから:統合されたモデルをデプロイし、各セグメントにスコアリングコードがあることを確認して、デプロイ済みの統合されたモデルからスコアリングコードをダウンロードします。
スコアリングコードの予測区間¶
時系列モデルのダウンロード済みスコアリングコードJARに予測区間を含めることができるようになりました。 サポート間隔は1~99です。
予測区間を含むスコアリングコードのダウンロード¶
予測間隔を有効にしてスコアリングコードJARをダウンロードするには:
-
リーダーボードから: 予測間隔を含めるを有効にして、スコアリングコードをダウンロードします。
-
デプロイから:モデルをデプロイし、予測間隔を含めるを有効にして、スコアリングコードをダウンロードします。
予測区間を使用したCLIの例¶
以下は、予測区間を使用してモデルをスコアリングするCLIの例です。
java -jar model.jar csv \
--input=syph.csv \
--output=output.csv \
--with_intervals \
--interval_length=87