DataRobot Prime(廃止)¶
本機能の提供について
新規にDataRobot Primeモデルを作成する機能は、アプリケーションから削除されました。 これは既存のPrimeモデルやデプロイには影響しません。 将来的にPythonコードをエクスポートするには、任意のRuleFitモデルでPythonコードエクスポート関数を使用します。
DataRobot Primeは使用非推奨ですが、リーダーボードで既存のDataRobot Primeモデルを表示し、近似コードをダウンロードすることは引き続き可能です。 該当するモデルのソースコードは、PythonモジュールまたはJavaクラスとして生成することができます。 これを行うには、リーダーボードで、使用非推奨のDataRobot Primeモデルを見つけて開き、予測 > ダウンロードをクリックします。 RuleFitコードをダウンロードグループボックスで、PythonまたはJavaを選択し、ダウンロードをクリックして、DataRobot Primeモデルのスコアリングコードをダウンロードします。
PythonまたはJavaのDataRobot Prime近似コードをダウンロードすると、ローカルで実行できます。 詳細については、以下の例を参照してください。
ダウンロードしたコードをPythonで実行するには、以下の環境が必要です。
- Python(推奨:3.7)
- Numpy(推奨:1.16)
- Pandas < 1.0(推奨:0.23)
ダウンロードしたモデルで予測を行うには、エクスポートしたPythonスクリプトファイルを以下のコマンドで実行します。
python <prediction_file> --encoding=<encoding> <data_file> <output_file>
プレースホルダー | 説明 |
---|---|
prediction_file | は、ダウンロードしたPythonコード版のRuleFitモデルを指定します。 |
エンコーディング | (オプション)予測の作成で使用するデータセットのエンコーディングを指定します。 特に指定しない場合、RuleFitのデフォルトはUTF-8です。 使用可能なその他のエントリーについては、Pythonでサポートされる標準のチャートの「コーデック」列を参照してください。 |
data_file | csvファイル(データセット)を指定します。 列はRuleFitモデルの生成に使用する特徴量セットに対応する必要があります。 |
output_file | は、DataRobotが結果を書き込むファイル名を指定します。 |
この例では、rulefit.py
は、以下のデータセットでトレーニングしたRuleFitモデルを含むPythonスクリプトです。
race,gender,age,readmitted
Caucasian,Female,[50-60),0
Caucasian,Male,[50-60),0
Caucasian,Female,[80-90),1
以下のコマンドを実行すると、data.csv
のデータに対する予測が生成され、results.csv
に結果が出力されます。
python rulefit.py data.csv results.csv
ファイルdata.csv
は拡張子csvのファイルで以下のように表示されます。
race,gender,age
Hispanic,Male,[40-50)
Caucasian,Male,[80-90)
AfricanAmerican,Male,[60-70)
results.csv
の結果は次のようになります。
Index,Prediction
0,0.438665626555
1,0.611403738867
2,0.269324648106
ダウンロードしたコードをJavaで実行するには:
- Javaバージョン1.7.x以降のJDKを使用する必要があります。
- ファイル内のクラスの名前を変更しないでください。
- コードを実行するにはApache Commons CSVライブラリバージョン1.1以降を含める必要があります。
- エクスポートされたコードのJavaファイルの名前を
Prediction.java
に変更する必要があります。
Javaファイルをコンパイルするには、以下のコマンドを実行します。
javac -cp ./:./commons-csv-1.1.jar Prediction.java -d ./ -encoding 'UTF-8'
コンパイル済のJavaクラスを実行するには、以下のコマンドを実行します。
java -cp ./:./commons-csv-1.1.jar Prediction <data file> <output file>
プレースホルダー | 説明 |
---|---|
data_file | は、.csvファイル(データセット)を指定します。列はRuleFitモデルの生成に使用する特徴量セットに対応する必要があります。 |
output_file | は、DataRobotが結果を書き込むファイル名を指定します。 |
以下の例を実行すると、data.csv
のデータに対する予測が生成され、results.csv
に結果が出力されます。
javac -cp ./:./commons-csv-1.1.jar Prediction.java -d ./ -encoding 'UTF-8'
java -cp ./:./commons-csv-1.1.jar Prediction data.csv results.csv
入出力データの詳細な形式については、Pythonの例を参照してください。