モデリングを開始¶
DataRobotでモデルを構築するには、まずデータセットをインポートしてプロジェクトを作成します。次にターゲット特徴量を選択し、開始ボタンをクリックしてモデリング処理を開始します。 DataRobotプロジェクトには、インポートしたデータセットで構築した全てのモデルが含まれます。 以下の手順は、DataRobotでデータのモデリングを開始する方法の簡単な概要を示します。 必要な場合は、手順内のリンクをクリックすると詳細なドキュメントが表示されます。
1:新規のDataRobotプロジェクトを作成¶
新規プロジェクトページでいずれかの方法を用いてデータセットをインポートし、新しいDataRobotプロジェクトを作成します。
ファイルサイズ制限に関する情報については、ファイルタイプのリファレンスを参照してください。
2:モデリングの設定をする¶
モデリングを開始するには、ターゲットの名前を入力し、以下に説明するオプション設定を設定します。
要素 | 説明 | |
---|---|---|
1 | 何を予測しますか? | ターゲット特徴量(予測するデータセットの列)の名前を入力するか、以下の特徴量セットの名前の横にあるターゲットとして使うをクリックします。 |
2 | ターゲットなし? | クリックして教師なしモデルを構築します。 |
3 | セカンダリーデータセット | (オプション)+ データセットを追加をクリックしてセカンダリーデータセットを追加します。 DateRobotは特徴量探索を実行し、データセットとの関係性を作成します。 |
4 | 特徴量セット | モデルのトレーニングに使用する特徴量セットを表示します。 |
5 | 最適化指標 | (オプション)最適化指標を選択しモデルをスコアリングします。 選択したターゲット特徴量およびモデリングプロジェクトの種類(連続値、分類、多クラス、教師なしなど)に基づいて指標を自動的に選択します。 |
6 | 高度なオプションを表示 | パーティショニング、バイアスと公平性、最適化指標などのモデリングオプションを指定します(その他をクリックします)。 |
7 | 時間認識モデリング | 時間特徴量に基づいて時間認識モデルを構築します。 |
画面の下方向にスクロールして、使用可能な特徴量のリストを表示します。 (オプション)モデルトレーニングに使用する特徴量セットを選択します。 右側のデータ品質評価領域で情報を表示をクリックして、特徴量の品質を調査します。
3:モデリングを開始¶
ターゲット特徴量を指定したら、モデリングモードを選択して、DataRobotにより多いまたは少ない数のモデルを構築するように指示し、開始をクリックしてモデリングを開始することができます。
ヒント
データセットが大きい場合は、早期ターゲット選択のセクションを参照してください。
または、各種の高度なオプションを設定して、プロジェクトのモデル構築プロセスを微調整することができます。
プロジェクトが準備され(EDA2)、モデルの実行が開始します。 実行中のモデルの進捗インジケーターが画面右側のワーカーキューに表示されます。 データセットのサイズによっては、モデリング処理を完了するのに数分かかる場合があります。 モデリング処理の結果は(選択した最適化指標に基づいて)パフォーマンスが最も優れているモデルがリストの上位にランク付けされた状態でモデルのリーダーボードに表示されます。
4:モデルの詳細を確認する¶
リーダーボードでモデルをクリックすると、モデルのブループリントが表示され、モデルの情報とインサイトを調査するための多くのタブにアクセスできます。
5:デプロイ前に予測をテストする¶
予測 > 予測を作成を選択することによって、運用環境にデプロイすることなくモデルの予測を手動でテストおよび生成できます。 ファイルを画面にドラッグアンドドロップするか、ドロップダウンのオプションを使用してデータセットを提供します。 データセットのアップロードが完了した後、予測を計算をクリックして新しいデータセットの予測を生成します。完了したら、ダウンロードをクリックして、CSVファイルに結果を表示します。
次のステップ¶
ここから、次のことができます。