Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

コマンドラインでのスコアリング

次のセクションでは、コマンドラインでのスコアリングの構文を示します。

コマンドラインパラメーター

フィールド 必須 デフォルト 説明
--help いいえ 無効 使用可能なすべてのオプションに加えて、いくつかのモデルメタデータを出力します。
--input=<value> 可能 なし 入力データのソースを定義します。 有効な値:
  • --input=- 標準入力からの入力を設定します
  • --input=</path/to/input/csv>/input.csv データのソースを設定します。
--output=<value> 可能 なし 結果の出力方法を設定します。 有効な値:
  • --output=- 標準の出力に結果を書き込みます
  • --output=/path/to/output/csv/output.csv 結果をファイルに保存します。 出力ファイルには、常に同じ順序で元のファイルと同じ数の行が含まれます。 1GBよりも小さいファイルの場合、入力ファイルと同じ出力ファイルを指定して、入力ファイルをスコアリング済みのファイルで置き換えることができます。
--encoding=<value> いいえ デフォルトのシステムエンコーディング ファイルのコンテンツを読み取るために使用する文字エンコーディングを設定します。 java.io APIおよびjava.lang APIの標準的な名前を使用してください。 このオプションを設定しない場合、ツールはUTF8およびUTF16 BOMを検出できます。
--delimiter=<value> いいえ ,(コンマ) 列の間の値を分割するためにCSVファイルで使用する区切り文字を指定します。備考: --delimiter=“;”オプションを使用するとセミコロン(;)を区切り文字として使用できます(;はbash/shellで予約済みの記号です)。
--passthrough_columns いいえ なし 入力列に結果ファイルを含めます。 たとえば、フラグに列のセット(column1,column2など)が含まれる場合、出力には予測列、および列1と2だけが含まれます。 元の列をすべて含めるには、Allを使用します。 結果のファイルには同じ順序で列が含まれ、delimitersパラメーターと同じ形式と同じ値を使用します。 パラメーターを指定しない場合、このコマンドでは予測列だけが返されます。
--chunk_size=<value> いいえ 最小(1 MB、{file_size}/{cores_number}) 初期データセットを複数のチャンクに「スライス」して、個別の非同期タスクのシーケンスでスコアリングします。 ほとんどの場合、デフォルト値で最良のパフォーマンスが生成されます。 スライスの部分を大きくするとモデルのスコアリング速度が速くなり、小さくするとスコアリング速度が遅くなります。
--workers_number=<value> いいえ 論理コアの数 複数の作業を同時に処理できるワーカーの数を指定します。 デフォルトでは、この値は論理コアの数に一致し、最良のパフォーマンスが得られます。
--log_level=<value> いいえ INFO コンソールに出力する情報のレベルを設定します。 使用可能なオプションは、INFO、およびTRACEです。
--fail_fast いいえ 無効 エラー処理を設定します。
  • このオプションを設定しないと、行に含まれるフィールドの数が正しくない場合やいずれかのフィールドのタイプがモデルで予期されているタイプと異なる場合、予測値の代わりに空の文字列が出力されます。
  • 設定した場合、ツールは最初のエラーで終了し、リターンコードとして1が返されます。 すべての場合において、すべてのエラーは標準のエラー出力(コンソール)に出力されます。 --fail_fastオプションは、OutOfMemoryErrorの際にゼロ以外の終了コードを保証しません。 これが必要な場合は、-XX:+ExitOnOutOfMemoryErrorフラグを使用します。
--pred_name=<value> いいえ DR_Score For regression projects, this field sets the name of the prediction column in the output file. 分類プロジェクトの場合、予測ラベルはクラスラベルと同じになります。
--buffer_size=<value> いいえ 1000 非同期タスクシーケンスのサイズを制御します。 このツールを使用している間にOutOfMemoryExceptionエラーが発生する場合、より小さな値に設定します。 これは高度なパラメーターです。
--config=<value> いいえ .jarファイルのディレクトリ batch.propertiesファイルの場所を設定すると、すべての構成パラメーターが単一のファイルに書き込まれます。 このファイルを.jarと同じディレクトリに配置する場合、このパラメーターを設定する必要はありません。 batch.propertiesを別のディレクトリに配置する場合、パラメーターの値をターゲットディレクトリのパスに設定する必要があります。
--with_explanations いいえ 無効 予測の説明の計算を有効にします。
--max_codes=<value> いいえ 3 計算する説明の最大数を設定します。
--threshold_low=<value> いいえ null 説明に含める予測行のしきい値(低)を設定します。
--threshold_high=<value> いいえ null 説明に含める予測行のしきい値(高)を設定します。
--enable_mlops いいえ 有効 スコアを追跡するMLOpsインスタンスを初期化します。
--dr_token=<value> --enabled_mlopsが設定されている場合は必須です。 なし Specifies the authorization token for monitoring agent requests.
--disable_agent いいえ 有効 --enable_mlopsを有効にすると、オフライン追跡を許可するかどうかを設定します。
時系列パラメーター
--forecast_point=<value> いいえ なし 予測を行うフォーマットされた日付。
--date_format=<value> いいえ なし 出力に使用する日付形式。
--predictions_start_date=<value> いいえ なし 予測の計算の開始タイミングを示すタイムスタンプ。
--predictions_end_date=<value> いいえ なし 予測の計算の終了タイミングを示すタイムスタンプ。
--with_intervals いいえ なし 予測区間の計算をオンにします。
--interval_length=<value> いいえ なし 1から99までのint値としての間隔の長さ。
--time_series_batch_processing いいえ 無効 Enables performance-optimized batch processing for time-series models.

備考

スコアリングコードの使用例も参照してください。

Javaヒープメモリーの増加

モデルのバイナリサイズによっては、Java仮想マシン(JVM)のヒープメモリーサイズを増やす必要があります。 モデルのスコアリングを行うときにOutOfMemoryError: Java heap space errorのエラーメッセージが表示された場合は、java -Xmx1024mを呼び出して数値を調整し、プロセスに十分なメモリーを割り当ててJavaヒープサイズを大きくしてください。 エラーが発生した場合にスコアリング結果の一貫性とゼロ以外の終了コードを保証するために、アプリケーションを-XX:+ExitOnOutOfMemoryErrorフラグで実行します。

次の例では、ヒープメモリーが2GBに増加します。

java -XX:+ExitOnOutOfMemoryError -Xmx2g -Dlog4j2.formatMsgNoLookups=true -jar 5cd071deef881f011a334c2f.jar csv --input=Iris.csv --output=Isis_out.csv 

更新しました December 21, 2022
Back to top