DataRobotワークフローの概要¶
DataRobotでモデルを構築するには、最初にデータセットをインポートしてプロジェクトを作成します。次にターゲット特徴量を選択し、「開始」ボタンをクリックしてモデリング処理を開始します。 DataRobotプロジェクトには、インポートしたデータセットで構築した全てのモデルが含まれます。
このプロセスはDataRobotにログインして開始します。
備考
組織でシングルサインオンに外部のアカウント管理システムが使用されている場合:
- LDAPが使用されている場合、ユーザー名は登録済みのEメールアドレスではない場合があります。 必要な場合は、DataRobot管理者に連絡してユーザー名を取得してください。
- SAMLベースのシステムが使用されている場合、ログインページの資格情報入力ボックスは無視してください。代わりに、シングルサインオンをクリックして、表示されるページに認証情報を入力します。
DataRobotでのデータのモデリング¶
以下の手順は、DataRobotでデータのモデリングを開始する方法の簡単な概要を示します。 必要な場合は、手順内のリンクをクリックすると詳細なドキュメントが表示されます。
備考
ファイルサイズ制限に関する情報については、ファイルタイプのリファレンスを参照してください。
-
新規プロジェクトページに表示される方法のいずれかを使用してデータセットをインポートすることによって、新規のDataRobotプロジェクトを作成します。
ファイルの処理中、進捗インジケーターが表示されます。
-
モデリングを開始するには、ターゲットの名前を入力し、以下に説明するオプション設定を設定します。
要素 説明 何を予測しますか? ターゲット特徴量(予測するデータセットの列)の名前を入力するか、以下の特徴量セットの名前の横にあるターゲットとして使うをクリックします。 ターゲットなし? クリックして教師なしモデルを構築します。 セカンダリーデータセット 必要に応じて、+ データセットを追加をクリックしてセカンダリーデータセットを追加します。 DateRobotは特徴量探索を実行し、データセットとの関係性を作成します。 特徴量セット モデルのトレーニングに使用する特徴量セットを表示します。 最適化指標 必要に応じて、最適化指標を選択しモデルをスコアリングします。 選択したターゲット特徴量およびモデリングプロジェクトの種類(連続値、分類、多クラス、教師なしなど)に基づいて指標を自動的に選択します。 高度なオプションを表示 パーティショニング、バイアスと公平性、最適化指標などのモデリングオプションを指定します(追加をクリック)。 時間認識モデリング 時間特徴量に基づいて時間認識モデルを構築します。 -
画面の下方向にスクロールして、使用可能な特徴量のリストを表示します。 必要に応じて、モデルトレーニングに使用する特徴量セットを選択します。 右側の[データ品質評価]領域の情報を表示をクリックして、特徴量の品質を調査します。
-
ターゲット特徴量を指定した後、モデリングモード を選択します。 (データセットが大きい場合は、早期ターゲット選択のセクションを参照してください。) 開始をクリックしてモデリングを開始します。
プロジェクトが準備され(EDA2)、モデルの実行が開始します。 実行中のモデルの進捗インジケーターが画面右側のワーカーキューに表示されます。 データセットのサイズによっては、モデリング処理を完了するのに数分かかる場合があります。
モデリング処理の結果は(選択した最適化指標に基づいて)パフォーマンスが最も優れているモデルがリストの上位にランク付けされた状態でモデルのリーダーボードに表示されます。
-
モデルをクリックするとモデルのブループリントが表示されます。さまざまなタブにアクセスして、モデル情報およびインサイトを精査します。
-
予測 > 予測の作成を選択することによって、運用環境にデプロイすることなくモデルからの予測を手動でテストおよび生成できます。 ファイルを画面にドラッグアンドドロップするか、ドロップダウンのオプションを使用してデータセットを提供します。 データセットのアップロードが完了した後、予測を計算をクリックして新しいデータセットの予測を生成します。完了したら、ダウンロードをクリックして、CSVファイルに結果を表示します。
-
予測の生成に使用するモデルを選択したら、予測 > デプロイタブに移動します。 推奨モデルでない場合、DataRobotはデプロイ用のモデルの準備を推奨します。 推奨モデルである場合は、モデルをデプロイをクリックします。
-
デプロイ情報ページに必要な情報を入力します。 完了したら、モデルをデプロイをクリックします。
-
その後、デプロイインベントリからモデルの正常性と予測統計を監視できます。