Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

コマンドラインでのスコアリング

次のセクションでは、コマンドラインでの現在のスコアリングおよび下位互換スコアリングの両方の構文を示します。

組み込みCLIでのスコアリング

バイナリスコアリングコードJARを使用してCSVファイルをスコアする完全な構文を以下に示します。

 $ java -Dlog4j2.formatMsgNoLookups=true -jar .jar csv --input= --output=
 [--help] [--encoding=] [--delimiter=] [--passthrough_columns=] [--chunk_size=]
 [--workers_number=] [--log_level=] [--fail_fast] [--pred_name=] [--timeout=]
 [--buffer_size=] [--model_id=] [--config=] [--with_explanations]
 [--max_codes=<value>] [--threshold_low=<value>] [--threshold_high=<value>]
 [--enable_mlops] [--dr_token=<value>] [--disable_agent]

例:

$ java -Dlog4j2.formatMsgNoLookups=true -jar 5cd071deef881f011a334c2f.jar csv --input=Iris.csv --output=Isis_out.csv

戻り値:

$ head Iris_out.csv
Iris-setosa,Iris-virginica,Iris-versicolor
0.9996371740832738,1.8977798830979584E-4,1.7304792841625776E-4
0.9996352462865297,1.9170611877686303E-4,1.730475946939417E-4
0.9996373523223016,1.8970270284380858E-4,1.729449748545291E-4

下位互換性のある外部ツール

バージョン5.2以前のDataRobotで生成されたスコアリングコードモデルには、組み込みのコマンドラインインターフェイスがありません。しかし、外部コマンドラインツールを使用してCSVファイルをスコアリングできます。

備考

外部ツールをダウンロードするには、JARとその依存ファイルをダウンロードする必要があります。そのためには、MVNリポジトリでツールのバージョンを選択して、ファイル -> 全て表示をクリックします。scoring-code-standalone-tool-version-jar-with-dependencies.jarをダウンロードします。

外部コマンドラインツールをダウンロードした後、以下のテンプレートコマンドを使用して.csvファイルをスコアリングします。

$ java -Dlog4j2.formatMsgNoLookups=true
-cp scoring-code-standalone-tool.jar:<scoring code jar file name>.jar
com.datarobot.prediction.Main csv --model_id=<model id> --input=<input file>
--output=<output file> [--help] [--encoding=<value>] [--delimiter=<value>]
[--passthrough_columns=<value>] [--chunk_size=<value>]
[--workers_number=<value>] [--log_level=<value>] [--fail_fast]
[--pred_name=<value>] [--timeout=<value>] [--buffer_size=<value>]
[--model_id=<value>] [--config=<value>] [--with_explanations]
[--max_codes=<value>] [--threshold_low=<value>] [--threshold_high=<value>]
[--enable_mlops] [--dr_token=<value>] [--disable_agent]

の場合、<model id>ダウンロードされたスコアリングコードJARの名前を指定します。例えば、のモデルIDは5d2db404dbaff900441cbc7c.jarです5d2db404dbaff900441cbc7c

Javaヒープメモリーを増やす

モデルのバイナリサイズによっては、Java仮想マシン(JVM)のヒープメモリーサイズを増やすことが必要な場合があります。モデルのスコアリングを行うときにOutOfMemoryError: Java heap space errorメッセージが表示された場合は、java -Xmx1024mを呼び出し、プロセスに十分なメモリーを割り当てるために必要な数に調整してJavaヒープサイズを増やしてください。エラーの際に、スコアリング結果の一貫性とゼロ以外の終了コードを保証するには、-XX:+ExitOnOutOfMemoryErrorフラグのあるアプリケーションを実行してください。

次の例では、ヒープメモリーが2GBに増加します。

$ java -XX:+ExitOnOutOfMemoryError -Xmx2g -Dlog4j2.formatMsgNoLookups=true -jar 5cd071deef881f011a334c2f.jar csv --input=Iris.csv --output=Isis_out.csv

コマンドラインパラメーター

フィールド 必須 デフォルト 説明
--input={value} はい なし 入力データのソースを定義します。有効な値は次のとおり
  • --input=- 標準入力からの入力を設定します
  • --input=</path/to/input/csv>/input.csv データのソースを設定します。
--output={value} はい なし 結果の出力方法を設定します。有効な値:
  • --output=- 標準の出力に結果を書き込みます
  • --output=/path/to/output/csv/output.csv 結果をファイルに保存します。出力ファイルには、常に同じ順序で元のファイルと同じ数の行が含まれます。1GBよりも小さいファイルの場合、入力ファイルと同じ出力ファイルを指定して、入力ファイルをスコアリング済みのファイルで置き換えることができます。
--encoding={value} いいえ デフォルトのシステムエンコーディング ファイルのコンテンツを読み取るために使用する文字エンコーディングを設定します。java.io APIjava.lang APIに正規名の1つを使用します。 このオプションを設定しない場合、ツールはUTF8およびUTF16 BOMを検出できます。
--delimiter={value} いいえ ,(コンマ) 列の間の値を分割するために.csvファイルで使用する区切り記号を指定します。メモ: オプションを--delimiter=“;”使用するとセミコロンを;区切り記号として使用できます(;はbash/shellで予約済みの記号です)。
--passthrough_columns いいえ なし 入力列に結果ファイルを含むよう設定します。たとえば、フラグに列のセット(などcolumn1,column2)が含まれる場合、出力には予測列、および列1と2だけが含まれます。元の列をすべて含めるには、を使用しますAll。結果のファイルには同じ順序で列が含まれ、delimitersパラメーターと同じ形式と同じ値を使用します。パラメーターを指定しない場合、このコマンドでは予測列だけが返されます。
--chunk_size={value} いいえ min(1MB, {file_size}/{cores_number}) 初期データセットを複数のチャンクに"スライス"して、個別の非同期タスクのシーケンスでスコアリングします。ほとんどの場合、デフォルト値で最良のパフォーマンスが発揮されます。より大きいチャンクは速度がとても速いモデルのスコアリングに使用され、より小さいチャンクは速度がとても遅いモデルのスコアリングに使用されます。
--workers_number={value} いいえ 論理コアの数 複数の作業を同時に処理できるワーカーの数を指定します。デフォルトでは、この値は論理コアの数に一致し、最良のパフォーマンスが得られます。
--help いいえ 無効 使用可能なすべてのオプションに加えて、いくつかのモデルメタデータを出力します。
--log_level={value} いいえ 情報 コンソールに出力する情報のレベルを設定します。使用可能なオプションは、INFO、DEBUGおよびTRACEです。
--fail_fast いいえ 無効 エラー処理を設定します。
  • 設定されていない場合、行が正しい数のフィールドを含まないか、フィールドの1つの型がモデルで期待される型と一致しない場合、ツールは予測値の代わりに空の文字列を出力します。
  • 設定すると、最初のエラーでツールが終了し、リターンコードとして1を返します。すべての場合において、すべてのエラーは標準のエラー出力(コンソール)に出力されます。の場合、--fail_fastオプションは0以外の終了コードを保証しません。OutOfMemoryErrorこれが必要な場合は、-XX:+ExitOnOutOfMemoryErrorフラグを使用します。
--pred_name={value} いいえ DR_Score 連続値プロジェクトの場合、出力ファイルの予測列の名前を設定します。分類プロジェクトの場合、予測ラベルはクラスラベルと同じになります。
--buffer_size={value} いいえ 1000 非同期タスクシーケンスのサイズを制御します。このツールを使用している間にOutOfMemoryExceptionエラーが発生する場合、より小さな値に設定します。これは高度なパラメーターです。
--config={value} いいえ .jarファイルのディレクトリ batch.propertiesファイルの場所を設定すると、すべての構成パラメーターが単一のファイルに書き込まれます。このファイルを.jarと同じディレクトリに配置する場合、このパラメーターを設定する必要はありません。をbatch.properties別のディレクトリに配置する場合、パラメーターの値をターゲットディレクトリのパスに設定する必要があります。
--with_explanations いいえ 無効 予測の説明の計算を有効にします。
--max_codes={value} いいえ 3 計算する説明の最大数を設定します。
--threshold_low={value} いいえ null 説明に含める予測行のしきい値(低)を設定します。
--threshold_high={value} いいえ null 説明に含める予測行のしきい値(高)を設定します。
--enable_mlops いいえ 有効 スコアを追跡するMLOpsインスタンスを初期化します。
--dr_token={value} --enabled_mlopsが設定されている場合は必要です。 なし エージェントリクエスト追跡用の認証トークンを指定します。
--disable_agent いいえ 有効 --enable_mlopsを有効にすると、オフライン追跡を許可するかどうかを設定します。

更新しました February 22, 2022
Back to top