DataRobot Primeタブ¶
本機能の提供について
DataRobot Primeの有効化については、DataRobotの担当者にお問い合わせください。
DataRobot Primeは、DataRobotアプリケーションの外部で使用する予測モデルを最適化します。DataRobot Primeには多くのメリットがあります。作成した予測モデルは、PythonモジュールまたはJavaクラスとしてエクスポートして、エクスポートしたスクリプトを実行することができます。DataRobot Primeは、特徴量の型変換を含む特徴量セットを使用するモデルもサポートします。
DataRobot Primeモデルは、リーダーボードのほとんどのモデルに対して構築できます。しかし、モデルが近似できないいくつかの状況があります。
DataRobot Primeモデルを作成する¶
DataRobot Primeは、プロジェクトの元の指標に対して最適なバランスであると判断した数の特徴量を使用して、予測を作成します。DataRobot Primeモデルを作成するには
-
任意のモデリングモードを使用してデータセットを処理します。
-
近似処理を行うモデルをリーダーボードで展開します。[DataRobot Prime]タブをクリックします。
-
表示される画面で[DATAROBOT PRIMEを実行]をクリックします。モデリングジョブがワーカーキューに追加され、処理が正常に完了したことを示すメッセージが表示されます。
ジョブが完了した後、新しいDataRobot Primeがモデルリーダーボードで使用できるようになります。以下の説明では、モデル名に親モデルの名前とモデル番号に加えて、ダウンロード可能なコードで使用されるルールの数が含まれます。
-
新しいDataRobot Primeモデルを展開して、[DataRobot Prime]タブをクリックし、グラフ(こちらを参照)を表示します。このグラフでは、10のルールカウントオプションがそれぞれの結果の指標スコアに対してプロットされます。
ルールカウントを変更する¶
DataRobotの初期設定では、最良のルールカウントに基づいてモデルの近似処理が行われます。しかし、ルールカウントを変更する理由があります。別のルールカウントを使用するには
- グラフから、選択内容に含まれるルールの数を確認します。
- 該当するラジオボタンをクリックして、新しいルールカウントを選択します。
- [続行]をクリックして新しいモデルのリクエストを確認します。新しいルールカウントで新しいDataRobot Primeモデルが生成され、リーダーボードにエントリーが追加されます。
DataRobot Primeモデルをエクスポートする¶
DataRobot Primeモデルのパフォーマンスが満足できるものであることを確認したら、予測を作成するコードを生成してダウンロードできます。
生成コードをダウンロードする¶
生成コードをダウンロードするには
-
左下にある[言語を選択]ドロップダウンを使用して、PythonまたはJavaのいずれかを選択します。
ヒント
生成されたソースコードをPythonで使用する際、UTF-8以外の文字セットを使用する場合はエンコーディングを指定する必要があります。
-
[コードの生成とダウンロード]をクリックします。モデルのコードを初めて生成する場合、Prime検定ジョブが起動して、生成するソースコードの整合性のテストと検証が行われます。ジョブの進捗状況はワーカーキューで監視できます。
-
テストが完了すると、検定が成功したか失敗したかを示すメッセージが表示され、コードをダウンロードするボタンが有効になります。
運用環境で使用するDataRobot Primeモデルコードをダウンロードするには、[生成済みコードをダウンロード]をクリックして、保存場所を指定します。これで、コードをDataRobotの外部で使用して予測を作成することができます。
デバッグ情報を使用する¶
コードを作成するとき、DataRobotでは各行の予測が試行されます。例外またはエラーが発生すると、エラーがコード出力(stderr
)に記録されます。生成コードの実行で問題が発生した場合、これらのメッセージを検索して、生成コードデータの整合性を検証できます。
たとえば、「正常」な生成コードでは以下が返されます。
def predict_dataframe(ds):
return ds.apply(predict, axis=1)
エラーコードの場合、次のような内容が返されます。
def predict_dataframe(ds):
try:
return ds.apply(predict, axis=1)
except TypeError as e:
sys.stderr.write('Error processing column: ' + unicode(e) +'\n')
os._exit(1)
DataRobot Primeモデルを使用する¶
選択した言語でDataRobot Primeモデルをエクスポートした後、エクスポートしたモデルを予測に使用できます。詳細については、Primeの例のセクションを参照してください。
さらに詳しい情報¶
このセクションでは、DataRobot Primeモデルに関する追加の詳細情報に加えて、検定が失敗した場合のヒントを提供します。
DataRobot Primeを使用する理由¶
DataRobot Prime は、以下を提供することによってモデルの透明性というDataRobotの目標をサポートします。
- 生成されたモデルおよびスコアリングコード。
- データの整合性を検証する係数モデル。
- 複数言語のサポート。
- DataRobot環境と(プライバシーの理由などで)必ずしも通信できないシステムへのDataRobotの統合。
- リーダーボードにも表示されるPrimeモデルによって立証されるパフォーマンスの証明。
- API呼び出しのオーバーヘッドなしでの低レイテンシースコアリング。たとえば、リアルタイムの低レイテンシースコアリングプラットフォームでGLMとカスタムコードを使用する場合、C++やJavaなどの高速な言語のルールベースのシステムでは、低レイテンシープラットフォーム上でDataRobotのPrimeコードエクスポートを使用して、API呼び出し時間のオーバーヘッドなしで直接スコアリングを行うことができます。
DataRobot Prime モデルの詳細¶
各グラフの結果の指標スコアに対してルールオプションがプロットされたグラフを表示するには、リーダーボードでDataRobot Primeモデルを展開し、[DataRobot Prime]タブをクリックします。
既存のPrimeモデルの[DataRobot Prime]タブページの要素を次の表に示します。
要素 | 説明 |
---|---|
元のプロジェクトビルドで使用された指標が表示されます。 | |
ルールカウントオプション(2) | 10のルールカウントオプション、およびモデルで使用できる関連付けられたメトリック価が一覧表示されます。異なるルールカウントで新しいモデルを構築するには、ラジオボタンをクリックします。 |
言語選択(3) | ダウンロード可能なコードの言語を選択する仕組みを提供します。 |
コード生成リンク(4) | DataRobot Primeモデルのエクスポートを行うためのコードの生成(およびダウンロード)プロセスを開始します。 |
ルールカウントを変更する理由¶
DataRobotの初期設定では、最良のルールカウントに基づいてモデルの近似処理が行われます。しかし、より良いルールカウントがあることがグラフで確認できた場合、ルールカウントを変更してモデルの簡素化やモデルへの詳細の追加を行うことができます。たとえば、選択された最良のルールよりも特定のルールカウントに含まれるルールの数が少ない場合、スコアリングペナルティは小さくなります。
ルールカウントを変更すると、新しいDataRobot Primeモデルが構築されて、リーダーボードに追加されます。ブループリントからの以前のDataRobot Primeモデルも引き続き使用できます。各モデルで個々にコードを生成してダウンロードする必要があります。
サポート対象の変換¶
特徴量に特徴量の型変換を適用し、変換した特徴量を使用して特徴量セットを作成する場合があります。特徴量の型変換(DataRobotで検出および割り当てられたタイプからユーザーが選択したタイプへの変換)を使用してDataRobot Primeモデルを作成できます。生成されたコードを変換された特徴量を含まないデータセット上で実行した場合、DataRobot Primeモデルは、最初の予測結果と同じ結果を返します。変換では「NaN」値を定義できるので、生成されたコードに含まれる無効な値は、ユーザーが定義した値で置き換えられます。
DataRobot Prime では、ユーザー定義の変換、対数変換、平方根変換、およびべき変換はサポートされません。以下の特徴量の型の変換を使用できます。
変換前 | 変換後 |
---|---|
日付 | カテゴリ |
日付 | 数値 |
数値 | カテゴリ |
カテゴリ | 数値 |
カテゴリ | テキスト |
テキスト | カテゴリ |
テキスト | 数値 |
検定が失敗した場合¶
ごく希に、コード生成のリクエストに対する応答の検定でエラーメッセージが表示されることがあります。このエラーの原因は2つあり、返されるメッセージにエラーの種類が表示されます。エラーメッセージが表示された場合でもコードのダウンロードは可能です。DataRobotカスタマーサポートにEメールを送信して問題を報告してください。失敗の理由を以下に示します。
-
生成されたコードからの予測とDataRobot Primeモデルの予測の近似が十分でない。この場合でも生成されたコードは引き続き実行できます。
-
データの問題やメモリー不足のエラーなどが原因で、生成されたコードを実行できない。この場合、生成されたコードは実行できないことがあります。問題がデータにある場合、コードは実行される可能性は低くなります。メモリーエラーの場合、ローカルマシンのメモリーが十分であれば(コードを検証しようとするワーカーのメモリーが不十分であっても)コードは実行されることがあります。
状況によって異なる結果が得られると考えられる場合は、検定を再実行できます。検定ジョブを再実行するには
- DataRobot Primeモデルを削除します。
- モデルを再度実行します(元のモデルの近似処理を再度実行するか、[DataRobot Prime]タブグラフから新しいモデルを生成します)。
- [コードの生成とダウンロード]をクリックして、検定ジョブを再度実行します。
それでも検定が失敗する場合は、エラーが示されるモデルのリンクをクリックします。Eメールクライアントが開き、件名およびサポートによる問題のトラブルシューティングに役立つメッセージ本文を含むDataRobotカスタマーセンター宛のメッセージが作成されます。必要に応じて、情報を追加することができます。