時系列プロジェクトのスコアリングコード¶
スコアリングコードは、DataRobotアプリケーションの外でDataRobotモデルを利用するための、ポータブルかつ低レイテンシーな手法です。 You can export time series models in a Java-based Scoring Code package from:
Time series Scoring Code availability
The following blueprints typically support Scoring Code:
- 固定エラー条件を含むAUTOARIMA
- 線形的に減退する加重を使用する予測距離モデリング付きのElasticNetリグレッサー(L2 / Gamma Deviance)
- 予測距離モデリング付きのElasticNetリグレッサー(L2 / Gamma Deviance)
- 線形的に減退する加重を使用する予測距離モデリング付きのElasticNetリグレッサー(L2 / Poisson Deviance)
- 予測距離モデリング付きのElasticNetリグレッサー(L2 / Poisson Deviance)
- Eureqa一般加法モデル(250世代)
- Eureqa一般加法モデル(250世代)(Gamma Loss)
- Eureqa一般加法モデル(250世代)(Poisson Loss)
- Eureqaリグレッサー(クイック検索:250世代)
- eXtreme Gradient Boosted Treesリグレッサー
- eXtreme Gradient Boosted Treesリグレッサー)(Gamma Loss)
- eXtreme Gradient Boosted Treesリグレッサー)(Poisson Loss)
- Early Stopping搭載のExtreme Gradient Boosted Treesリグレッサー
- Early Stopping搭載のExtreme Gradient Boosted Treesリグレッサー(高速特徴量ビニング)
- Early Stopping搭載のExtreme Gradient Boosted Treesリグレッサー(Gamma Loss)
- Early Stopping搭載のExtreme Gradient Boosted Treesリグレッサー(学習レート =0.06)(高速特徴量ビニング)
- ElasticNet予測でのeXtreme Gradient Boosting
- ElasticNet予測でのeXtreme Gradient Boosting(Poisson Loss)
- ElasticNet予測でのLight Gradient Boosting
- ElasticNet予測でのLight Gradient Boosting(Gamma Loss)
- ElasticNet予測でのLight Gradient Boosting(Poisson Loss)
- 予測距離モデリングを使用する、パフォーマンスクラスター化されたElastic Netリグレッサー
- Elastic Net予測でのパフォーマンスクラスター化されたeXtreme Gradient Boosting
- RandomForestリグレッサー
- 線形的に減退する加重を使用する予測距離モデリング付きのRidgeリグレッサー
- 予測距離モデリング付きのRidgeリグレッサー
- 固定エラー条件を伴うベクター自己回帰モデル(VAR)
- キャリブレーションによる分離フォレスト異常検知(時系列)
- 教師あり学習(XGB)とキャリブレーション(時系列)による異常検知
While the blueprints listed above support Scoring Code, there are situations when Scoring Code is unavailable:
- スコアリングコードは、特徴量探索を使用して生成された一部のモデルでは使用できない場合があります。
- スコアリングコードは、高解像度のカレンダーを使用するプロジェクトでのみサポートされています。 高解像度のカレンダーを使用していない場合、既存のプロジェクトで作成されたモデルのスコアリングコードは生成されません。
- イベントがデータセットにない場合、日付レベル以外のカレンダーで整合性の問題が発生する可能性があります。 この場合、スコアリングコードのダウンロードはできません。
- Consistency issues can occur when inferring the forecast point in situations with a non-zero blind history. この場合、スコアリングコードのダウンロードはできません。
- Scoring Code might not be available for some models that use text tokenization involving the MeCab tokenizer.
- Differences in rolling sum computation can cause consistency issues in projects with a weight feature and models trained on feature lists with
weighted std
orweighted mean
.
Time series Scoring Code capabilities
The following capabilities are currently supported for time series Scoring Code:
- コマンドラインでのスコアリング用の時系列パラメーター。
- セグメント化されたモデリング
- 予測間隔
- カレンダー(高解像度)
- 交差系列
- ゼロ過剰/ナイーブ二値
- ナウキャスティング(履歴範囲予測)
- ブラインド履歴ギャップ
- 加重特徴量
スコアリングコードでは次の時系列機能はまだサポートされていません。
- 行ベース/不規則なデータ
- ナウキャスティング(単一の予測ポイント)
- 月内の季節性
- 時系列アンサンブル
- 自動拡張 *(EWMA)指数加重移動平均
CLIスコアリングの時系列パラメーター¶
DataRobot supports using scoring at the command line. The following table describes the time series parameters:
フィールド | 必須 | デフォルト | 説明 |
---|---|---|---|
--forecast_point=<value> |
いいえ | なし | 予測を行うフォーマットされた日付。 |
--date_format=<value> |
いいえ | なし | 出力に使用する日付形式。 |
--predictions_start_date=<value> |
いいえ | なし | 予測の計算の開始タイミングを示すタイムスタンプ。 |
--predictions_end_date=<value> |
いいえ | なし | 予測の計算の終了タイミングを示すタイムスタンプ。 |
--with_intervals |
いいえ | なし | 予測区間の計算をオンにします。 |
--interval_length=<value> |
いいえ | なし | 1から99までのint 値としての間隔の長さ。 |
--time_series_batch_processing |
いいえ | 無効 | Enables performance-optimized batch processing for time-series models. |
セグメント化されたモデリングプロジェクトのスコアリングコード¶
セグメントモデリングでは、複数系列プロジェクトのセグメントに対して個別のモデルを構築することができます。 そして、DataRobotはこれらのモデルを統合し、統合モデルを作成します。
備考
Scoring Code support is available for segments defined by an ID column in the dataset, not segments discovered by a clustering model.
セグメントモデルにスコアリングコードがあることを確認します¶
セグメントのチャンピオンモデルにスコアリングコードがない場合は、スコアリングコードがあるモデルを選択します。
-
リーダーボードの結合モデルに移動します。
-
From the Segment dropdown menu, select a segment. セグメントのチャンピオンを見つけます(セグメントチャンピオンインジケーターで指定)。
-
セグメントチャンピオンにスコアリングコードインジケーターがない場合は、モデリング要件を満たし、スコアリングコードインジケーターがある新規モデルを選択します。 次に、上部のメニューからリーダーボードオプション > モデルをチャンピオンにするを選択します。
セグメントには、スコアリングコードを持つセグメントチャンピオンが表示されます。
-
結合モデルの各セグメントに対してこのプロセスを繰り返し、すべてのセグメントチャンピオンがスコアリングコードを持っていることを確認します。
結合モデルのスコアリングコードのダウンロード¶
結合モデルのスコアリングコードJARをダウンロードするには:
-
From the leaderboard: Download the Scoring Code from the Combined Model.
-
From a deployment: Deploy your Combined Model, ensure that each segment has Scoring Code, and download the Scoring Code from the Combined Model deployment.
スコアリングコードの予測区間¶
時系列モデルのダウンロード済みスコアリングコードJARに予測区間を含めることができるようになりました。 サポート間隔は1~99です。
予測区間を含むスコアリングコードのダウンロード¶
To download the Scoring Code JAR with prediction intervals enabled:
-
From the leaderboard: Download the Scoring Code with Include Prediction Intervals enabled.
-
From a deployment: Deploy your model and download the Scoring Code with Include Prediction Intervals enabled.
予測区間を使用したCLIの例¶
以下は、予測区間を使用してモデルをスコアリングするCLIの例です。
java -jar model.jar csv \
--input=syph.csv \
--output=output.csv \
--with_intervals \
--interval_length=87