Skip to content

How-to:連続値のターゲットを予測する

この基本ステップでは、機械学習を使用して、まだ設計されていない新車の燃費を予測モデルを使って予測するアプリケーションを構築します。 モデルは数値を予測する必要があるため、これは連続値問題です。 この基本ステップでは、継続的なターゲットに対する予測の定義、設定、評価、解釈の方法を説明します。 その後、新しいデータを追加することで予測を行うことができるアプリケーションを作成します。

ダウンロードするアセット

この基本ステップに従って操作するには、使用するデータセットを以下からダウンロードしてください。

データセットのダウンロード

自動車の燃費データ

このデータセットには、設計および試験が実施された自動車に関する情報が含まれています。 データは米国環境保護庁(EPA)の2020年版燃費ガイドより取得したものです。

このデータセットの各行は、自動車に関する情報(メーカー、モデル、駆動系、およびその他の仕様)を表しています。 データセットは、fueleconomy.gov Webサイトの公開データに基づいています。

データセットに関するお知らせ

このデータセットは、この演習で使用するためにクリーニングおよび修正されました。

このデータは、EPAの全米自動車・燃料排出ガス研究所で実施された車両試験および自動車メーカーからのものです。 各フィールドのデータディクショナリも公開されています。

Define the target

ターゲットは自動車の燃費であり、マイル/ガロン(MPG)で測定されています。 これはTrue/FalseやYes/Noのような二値ではなく、連続変数(数値)であるため、連続値問題になります。

その他の列には、MPGの予測に役立つ情報が含まれています。

プロジェクトの設定

DataRobotでのデータ分析入門に記載されている手順に従って、プロジェクトを設定します。 基本ステップで提供されているデータセットの代わりにcars2020.csvデータセットを使用します。 プロジェクトが設定されたら、エクスペリメントの作成に進みます。

エクスペリメントを作成

このセクションの手順では、MPG特徴量で示される車の燃費を予測するのに役立つエクスペリメントを構築します。

  1. データセットのデータビューから、データのアクション > モデリングを開始をクリックします。

  2. 新しいエクスペリメントを設定ウィンドウで、ターゲット特徴量フィールドにMPGを指定します。 また、ターゲットタイプ連続値に設定されていることを確認します。

  3. 残りのフィールドはデフォルトのままにして、Nextへ >をクリックします。

    備考

    追加設定の詳細については、モデリング設定の開始を参照してください。

  4. すべてのパーティショニング変更フィールドをデフォルトのままにして、モデリングを開始をクリックします。 しばらくすると、モデルリーダーボードが表示され、トレーニングの進捗状況が示されます。

    モデル構築にかかる時間

    モデル構築にかかる時間は、データセットのサイズによって異なります。 完了すると、ワーカーペインに「現在実行中のジョブはありません」と表示されます。

  5. モデルが構築されると、モデルリーダーボードには、最上位のモデルがデプロイの準備済みと示されます。 クリックするとモデルの詳細が表示されます。

構築後の各モデルの評価方法について詳しくは、モデルを比較モデルインサイトでの評価を参照してください。

アプリケーションを作成して予測を行う

最適なモデルが特定されたので、それを登録して本番環境にデプロイし、予測の作成に使用できます。 以下の手順で、予測に使用できるアプリケーションを作成します。

  1. 最適なモデルの詳細ページから、モデルのアクション > ノーコードアプリを作成をクリックします。

  2. アプリケーションが作成されたら、左側のナビゲーションペインで予測をクリックします。

  3. ページがリフレッシュされ、アプリケーション内のすべての予測データが表示されます。 単一の予測を送信セクションまでスクロールダウンし、予測を作成をクリックします。

  4. 新しい予測を追加ウィンドウでは、新しい予測を行う際に使用する特徴量を指定できます。 この例では、以下の表の値を指定します。

    特徴量
    Displacement(排気量) 10
    Cylinders(気筒数) 16
    Transmission(トランスミッション) Auto(AM-S7)
    ドライブ 全輪駆動
    Gears(ギア数) 7
    Exhaust Valves Per Cyl(排気バルブ数 / 気筒) 2
    Intake Valves Per Cyl(吸気バルブ数 / 気筒) 2
    Recommended Fuel(推奨する燃料) ディーゼル
    Model Index(モデルインデックス) 121
    Max Ethanol(最大エタノール濃度) 10
  5. 予測を追加をクリックします。

  6. 新しい予測が、予測セクションの最初の行に表示されます。 この場合、予測される燃費は11.152MPGです。

必要に応じて、上記の手順を繰り返して追加の予測を生成します。 複数の予測を一度に行いたい場合は、バッチ予測セクションで、予測値を含むCSVファイルをアップロードできます。

カスタムアプリケーションの作成および操作方法の詳細については、カスタムアプリケーションの作成を参照してください。