コマンドラインでのスコアリング¶
次のセクションでは、コマンドラインでのスコアリングの構文を示します。
コマンドラインパラメーター¶
フィールド | 必須 | デフォルト | 説明 |
---|---|---|---|
--help |
いいえ | 無効 | 使用可能なすべてのオプションに加えて、いくつかのモデルメタデータを出力します。 |
--input=<value> |
可能 | なし | 入力データのソースを定義します。 有効な値:
|
--output=<value> |
可能 | なし | 結果の出力方法を設定します。 有効な値:
|
--encoding=<value> |
いいえ | デフォルトのシステムエンコーディング | ファイルのコンテンツを読み取るために使用する文字エンコーディングを設定します。 java.io API およびjava.lang API の標準的な名前を使用してください。 このオプションを設定しない場合、ツールはUTF8およびUTF16 BOMを検出できます。 |
--delimiter=<value> |
いいえ | , (コンマ) |
列の間の値を分割するためにCSVファイルで使用する区切り文字を指定します。備考: --delimiter=“;” オプションを使用するとセミコロン(; )を区切り文字として使用できます(; はbash/shellで予約済みの記号です)。 |
--passthrough_columns |
いいえ | なし | 入力列に結果ファイルを含めます。 たとえば、フラグに列のセット(column1,column2 など)が含まれる場合、出力には予測列、および列1と2だけが含まれます。 元の列をすべて含めるには、All を使用します。 結果のファイルには同じ順序で列が含まれ、delimiters パラメーターと同じ形式と同じ値を使用します。 パラメーターを指定しない場合、このコマンドでは予測列だけが返されます。 |
--chunk_size=<value> |
いいえ | 最小(1 MB、{file_size}/{cores_number}) | 初期データセットを複数のチャンクに「スライス」して、個別の非同期タスクのシーケンスでスコアリングします。 ほとんどの場合、デフォルト値で最良のパフォーマンスが生成されます。 スライスの部分を大きくするとモデルのスコアリング速度が速くなり、小さくするとスコアリング速度が遅くなります。 |
--workers_number=<value> |
いいえ | 論理コアの数 | 複数の作業を同時に処理できるワーカーの数を指定します。 デフォルトでは、この値は論理コアの数に一致し、最良のパフォーマンスが得られます。 |
--log_level=<value> |
いいえ | INFO | コンソールに出力する情報のレベルを設定します。 使用可能なオプションは、INFO、およびTRACEです。 |
--fail_fast |
いいえ | 無効 | エラー処理を設定します。
|
--pred_name=<value> |
いいえ | DR_Score | For regression projects, this field sets the name of the prediction column in the output file. 分類プロジェクトの場合、予測ラベルはクラスラベルと同じになります。 |
--buffer_size=<value> |
いいえ | 1000 | 非同期タスクシーケンスのサイズを制御します。 このツールを使用している間にOutOfMemoryException エラーが発生する場合、より小さな値に設定します。 これは高度なパラメーターです。 |
--config=<value> |
いいえ | .jarファイルのディレクトリ | batch.properties ファイルの場所を設定すると、すべての構成パラメーターが単一のファイルに書き込まれます。 このファイルを.jarと同じディレクトリに配置する場合、このパラメーターを設定する必要はありません。 batch.properties を別のディレクトリに配置する場合、パラメーターの値をターゲットディレクトリのパスに設定する必要があります。 |
--with_explanations |
いいえ | 無効 | 予測の説明の計算を有効にします。 |
--max_codes=<value> |
いいえ | 3 | 計算する説明の最大数を設定します。 |
--threshold_low=<value> |
いいえ | null | 説明に含める予測行のしきい値(低)を設定します。 |
--threshold_high=<value> |
いいえ | null | 説明に含める予測行のしきい値(高)を設定します。 |
--enable_mlops |
いいえ | 有効 | スコアを追跡するMLOpsインスタンスを初期化します。 |
--dr_token=<value> |
--enabled_mlopsが設定されている場合は必須です。 | なし | Specifies the authorization token for monitoring agent requests. |
--disable_agent |
いいえ | 有効 | --enable_mlopsを有効にすると、オフライン追跡を許可するかどうかを設定します。 |
時系列パラメーター | |||
--forecast_point=<value> |
いいえ | なし | 予測を行うフォーマットされた日付。 |
--date_format=<value> |
いいえ | なし | 出力に使用する日付形式。 |
--predictions_start_date=<value> |
いいえ | なし | 予測の計算の開始タイミングを示すタイムスタンプ。 |
--predictions_end_date=<value> |
いいえ | なし | 予測の計算の終了タイミングを示すタイムスタンプ。 |
--with_intervals |
いいえ | なし | 予測区間の計算をオンにします。 |
--interval_length=<value> |
いいえ | なし | 1から99までのint 値としての間隔の長さ。 |
--time_series_batch_processing |
いいえ | 無効 | Enables performance-optimized batch processing for time-series models. |
備考
スコアリングコードの使用例も参照してください。
Javaヒープメモリーの増加¶
モデルのバイナリサイズによっては、Java仮想マシン(JVM)のヒープメモリーサイズを増やす必要があります。 モデルのスコアリングを行うときにOutOfMemoryError: Java heap space error
のエラーメッセージが表示された場合は、java -Xmx1024m
を呼び出して数値を調整し、プロセスに十分なメモリーを割り当ててJavaヒープサイズを大きくしてください。
エラーが発生した場合にスコアリング結果の一貫性とゼロ以外の終了コードを保証するために、アプリケーションを-XX:+ExitOnOutOfMemoryError
フラグで実行します。
次の例では、ヒープメモリーが2GBに増加します。
java -XX:+ExitOnOutOfMemoryError -Xmx2g -Dlog4j2.formatMsgNoLookups=true -jar 5cd071deef881f011a334c2f.jar csv --input=Iris.csv --output=Isis_out.csv
更新しました December 21, 2022
このページは役に立ちましたか?
ありがとうございます。どのような点が役に立ちましたか?
より良いコンテンツを提供するには、どうすればよいでしょうか?
アンケートにご協力いただき、ありがとうございました。