コマンドラインでのスコアリング¶
次のセクションでは、コマンドラインでの現在のスコアリングおよび下位互換スコアリングの両方の構文を示します。
組み込みCLIでのスコアリング¶
バイナリスコアリングコードJARを使用してCSVファイルをスコアする完全な構文を以下に示します。
$ java -Dlog4j2.formatMsgNoLookups=true -jar .jar csv --input= --output=
[--help] [--encoding=] [--delimiter=] [--passthrough_columns=] [--chunk_size=]
[--workers_number=] [--log_level=] [--fail_fast] [--pred_name=] [--timeout=]
[--buffer_size=] [--model_id=] [--config=] [--with_explanations]
[--max_codes=<value>] [--threshold_low=<value>] [--threshold_high=<value>]
[--enable_mlops] [--dr_token=<value>] [--disable_agent]
例:
$ java -Dlog4j2.formatMsgNoLookups=true -jar 5cd071deef881f011a334c2f.jar csv --input=Iris.csv --output=Isis_out.csv
戻り値:
$ head Iris_out.csv
Iris-setosa,Iris-virginica,Iris-versicolor
0.9996371740832738,1.8977798830979584E-4,1.7304792841625776E-4
0.9996352462865297,1.9170611877686303E-4,1.730475946939417E-4
0.9996373523223016,1.8970270284380858E-4,1.729449748545291E-4
下位互換性のある外部ツール¶
バージョン5.2以前のDataRobotで生成されたスコアリングコードモデルには、組み込みのコマンドラインインターフェイスがありません。しかし、外部コマンドラインツールを使用してCSVファイルをスコアリングできます。
備考
外部ツールをダウンロードするには、JARとその依存ファイルをダウンロードする必要があります。そのためには、MVNリポジトリでツールのバージョンを選択して、ファイル -> 全て表示をクリックします。scoring-code-standalone-tool-version-jar-with-dependencies.jar
をダウンロードします。
外部コマンドラインツールをダウンロードした後、以下のテンプレートコマンドを使用して.csvファイルをスコアリングします。
$ java -Dlog4j2.formatMsgNoLookups=true
-cp scoring-code-standalone-tool.jar:<scoring code jar file name>.jar
com.datarobot.prediction.Main csv --model_id=<model id> --input=<input file>
--output=<output file> [--help] [--encoding=<value>] [--delimiter=<value>]
[--passthrough_columns=<value>] [--chunk_size=<value>]
[--workers_number=<value>] [--log_level=<value>] [--fail_fast]
[--pred_name=<value>] [--timeout=<value>] [--buffer_size=<value>]
[--model_id=<value>] [--config=<value>] [--with_explanations]
[--max_codes=<value>] [--threshold_low=<value>] [--threshold_high=<value>]
[--enable_mlops] [--dr_token=<value>] [--disable_agent]
の場合、<model id>
ダウンロードされたスコアリングコードJARの名前を指定します。例えば、のモデルIDは5d2db404dbaff900441cbc7c.jar
です5d2db404dbaff900441cbc7c
。
Javaヒープメモリーを増やす¶
モデルのバイナリサイズによっては、Java仮想マシン(JVM)のヒープメモリーサイズを増やすことが必要な場合があります。モデルのスコアリングを行うときにOutOfMemoryError: Java heap space error
メッセージが表示された場合は、java -Xmx1024m
を呼び出し、プロセスに十分なメモリーを割り当てるために必要な数に調整してJavaヒープサイズを増やしてください。エラーの際に、スコアリング結果の一貫性とゼロ以外の終了コードを保証するには、-XX:+ExitOnOutOfMemoryError
フラグのあるアプリケーションを実行してください。
次の例では、ヒープメモリーが2GBに増加します。
$ java -XX:+ExitOnOutOfMemoryError -Xmx2g -Dlog4j2.formatMsgNoLookups=true -jar 5cd071deef881f011a334c2f.jar csv --input=Iris.csv --output=Isis_out.csv
コマンドラインパラメーター¶
フィールド | 必須 | デフォルト | 説明 |
---|---|---|---|
--input={value} | はい | なし | 入力データのソースを定義します。有効な値は次のとおり
|
--output={value} | はい | なし | 結果の出力方法を設定します。有効な値:
|
--encoding={value} | いいえ | デフォルトのシステムエンコーディング | ファイルのコンテンツを読み取るために使用する文字エンコーディングを設定します。java.io API とjava.lang API に正規名の1つを使用します。 このオプションを設定しない場合、ツールはUTF8およびUTF16 BOMを検出できます。 |
--delimiter={value} | いいえ | , (コンマ) |
列の間の値を分割するために.csvファイルで使用する区切り記号を指定します。メモ: オプションを--delimiter=“;” 使用するとセミコロンを; 区切り記号として使用できます(; はbash/shellで予約済みの記号です)。 |
--passthrough_columns | いいえ | なし | 入力列に結果ファイルを含むよう設定します。たとえば、フラグに列のセット(などcolumn1,column2 )が含まれる場合、出力には予測列、および列1と2だけが含まれます。元の列をすべて含めるには、を使用しますAll 。結果のファイルには同じ順序で列が含まれ、delimiters パラメーターと同じ形式と同じ値を使用します。パラメーターを指定しない場合、このコマンドでは予測列だけが返されます。 |
--chunk_size={value} | いいえ | min(1MB, {file_size}/{cores_number}) | 初期データセットを複数のチャンクに"スライス"して、個別の非同期タスクのシーケンスでスコアリングします。ほとんどの場合、デフォルト値で最良のパフォーマンスが発揮されます。より大きいチャンクは速度がとても速いモデルのスコアリングに使用され、より小さいチャンクは速度がとても遅いモデルのスコアリングに使用されます。 |
--workers_number={value} | いいえ | 論理コアの数 | 複数の作業を同時に処理できるワーカーの数を指定します。デフォルトでは、この値は論理コアの数に一致し、最良のパフォーマンスが得られます。 |
--help | いいえ | 無効 | 使用可能なすべてのオプションに加えて、いくつかのモデルメタデータを出力します。 |
--log_level={value} | いいえ | 情報 | コンソールに出力する情報のレベルを設定します。使用可能なオプションは、INFO、DEBUGおよびTRACEです。 |
--fail_fast | いいえ | 無効 | エラー処理を設定します。
|
--pred_name={value} | いいえ | DR_Score | 連続値プロジェクトの場合、出力ファイルの予測列の名前を設定します。分類プロジェクトの場合、予測ラベルはクラスラベルと同じになります。 |
--buffer_size={value} | いいえ | 1000 | 非同期タスクシーケンスのサイズを制御します。このツールを使用している間にOutOfMemoryException エラーが発生する場合、より小さな値に設定します。これは高度なパラメーターです。 |
--config={value} | いいえ | .jarファイルのディレクトリ | batch.properties ファイルの場所を設定すると、すべての構成パラメーターが単一のファイルに書き込まれます。このファイルを.jarと同じディレクトリに配置する場合、このパラメーターを設定する必要はありません。をbatch.properties 別のディレクトリに配置する場合、パラメーターの値をターゲットディレクトリのパスに設定する必要があります。 |
--with_explanations | いいえ | 無効 | 予測の説明の計算を有効にします。 |
--max_codes={value} | いいえ | 3 | 計算する説明の最大数を設定します。 |
--threshold_low={value} | いいえ | null | 説明に含める予測行のしきい値(低)を設定します。 |
--threshold_high={value} | いいえ | null | 説明に含める予測行のしきい値(高)を設定します。 |
--enable_mlops | いいえ | 有効 | スコアを追跡するMLOpsインスタンスを初期化します。 |
--dr_token={value} | --enabled_mlopsが設定されている場合は必要です。 | なし | エージェントリクエスト追跡用の認証トークンを指定します。 |
--disable_agent | いいえ | 有効 | --enable_mlopsを有効にすると、オフライン追跡を許可するかどうかを設定します。 |