Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

最適化アプリ(非推奨)

最適化アプリは、モデルの操作可能な特徴量の選択の値を変更することによって、ターゲットの予測の最大値または最小値を識別します。このアプリは、単一行に対して最適化を行うクラスで効果的です(サブスクリプションの更新価格など)。

たとえば、家屋の価格を最適化する場合を考えてみます。具体的には、特定の住宅を売却することでかなりの利益を上げながら、いくら投資する必要があるかを判断する必要があります。住宅の特定の特徴量は柔軟性があり(地下室の改修、新しいガレージの追加などに費やす金額)、その他は固定されます(建築年数、住んでいる地域)。固定特徴量と可変特徴量の両方の選択を元に、最適化アプリを使用して、どの選択肢(可変特徴量から派生)が最適な最大値(最高の販売価格)につながるかを予測できます。

開始

Optimizerアプリをまだデプロイしていない場合は、操作を続行する前にアプリケーションデプロイの一連のやり方を参照してください。取込み方法としてデータソースを使用している場合は、アプリをデプロイする前にターゲットを選択する必要があることに注意してください。取込み方法にデプロイを使用する場合、ターゲットは既に決定されています。

アプリの設定

最適化アプリをデプロイした後、最適化の実行前に最適化アプリのパラメーターを設定します。アプリケーション > 現在のアプリケーションに移動して、最適化アプリを開きます。

アプリのページで設定に移動を選択してアプリの設定を開始します。

最適化対象

このアプリには、より良いターゲットの予測値を得るための多くの設定があります。

フィールド 説明
最小化/最大化(1) ターゲット特徴量の予測値を最小化するか、最大化するかを設定します。最小化すると最低の出力(顧客の解約率など)を取得できます。最大化すると最大の出力(販売価格など)を取得できます。
最適化アルゴリズム(2) 有効になっている場合は、一覧表示されたアルゴリズムから選択し、実行するシミュレーションの回数を決めます。グリッドサーチ粒子群最適化、またはHyperoptアルゴリズムを選択します。または、選択した特徴量に最適なアルゴリズムを自動的に選択することもできます。グリッドサーチは、最大3つの柔軟な特徴量のオプションを徹底的に総当たりで検索します。以前の反復で強力な結果が示唆されていない場合でも、多くの可能性が試行されるので実行時間が長くなる可能性があります。粒子群最適化は、最大30の柔軟な特徴量に対して多くのオプションをテストするメタヒューリスティック戦略です。これは柔軟な数値特徴量には効果的ですが、柔軟なカテゴリー特徴量には効果的でない場合があります。Hyperoptでは、最大20の柔軟な特徴量で大幅に少ないオプションを効率的に探索します。これは、カテゴリー特徴量および数値特徴量に効果的です。このアルゴリズムでは、最大400のシミュレーションを設定できます。反復が多いほど良い結果が得られますが、収束に多くの反復が必要になるため、実行時間が長くなる可能性があります。
特徴量の合計に関する制約条件(3) 制約条件によって、各レコードの最適化の反復処理でターゲット特徴量の値を超える出力結果が取得されないよう制御されます。たとえば、家屋の価格を最適化する場合、地下室をリフォームするか、寝室を追加することによって居室面積を拡張することが考えられます。合計に関する制約条件を使用して、それぞれで占有できる床面積を制限します。制約値に対して「最大」(選択肢が超過しない)または「等しい」(選択肢は等値)を選択します。
カスタム最適化式(4) 最適化に複数のターゲット特徴量を含めることができます。複数の特徴量を使用する中カッコに含まれた等式を作成します( {converted} など){renewal_price}。サポートされる数式表現の一覧については、こちらを参照してください。

制約する特徴量を選択します

値を設定したら、合計について制約する対象とする特徴量を選択します。アプリを作成するために使用されたデプロイのデータソースの特徴量がページの下部に一覧表示されます。このリストから選択します。固定または可変の特徴量を選択できますが、少なくとも2つの数値特徴量を選択する必要があります。Hyperoptアルゴリズムを使用する場合、このオプションは使用できません。

バッチ予測用のカスタム式

さらに、バッチ予測の最適化を行う場合、アプリをデプロイしたデータセットの特徴量を使用する場合と同様に、カスタム最適化式の一部としてバッチアップロードで定義されたフィールドを使用します。たとえば、スプレッドシート内のフィールドに「net_profit」(純利益)というラベルを付け、プロジェクトのデータセットに「time_to_market」(市場投入までの時間)特徴量がある場合の有効なカスタム式を以下に示します。

`{net_profit}/{time_to_market}`

可変特徴量と制約

この設定ページのセクションでは、最適化された出力を検索する際に制御する要因を表す特徴量を選択できます。家屋の価格を最適化する場合、キッチンの品質、住宅ローンの費用、駐車場のサイズなどが可変特徴量になります。

データセットに10個以上の特徴量が含まれる場合、ページ切り替え、検索フィールド、またはフィルターを使用して特定の特徴量を見つけます。

可変特徴量を選択したら制約条件を適用します。数値制約の場合は指定された範囲内の値、カテゴリー特徴量の場合は特定の候補だけが対象になります。

特徴量に制約を適用するには、右側のドロップダウンメニューを展開します。

カテゴリー特徴量の場合、選択された値のエントリを確認または変更します。

数値特徴量の場合、最小および最大の数値範囲に値を入力するか、ヒストグラムの境界をドラッグすることができます。

「整数値」をオンにすると、整数値だけが含まれます(小数値が除外されます)。

保存をクリックして、特徴量の制約を確定し、ドロップダウンメニューを閉じます。

対応するチェックボックスをクリックして、シミュレーションに含める特徴量を選択します。

設定の構成が完了したら、設定を保存をクリックします。データポイントとデータセットページが開きます。

データセットとデータポイント

データポイントとデータセットページを使用して、最適化の 固定 特徴量を表すデータを入力します。これは定数であるか、制御できない特徴量のいずれかです。アプリで最適化を実行する際、これらの特徴量は一定に維持されます。可変特徴量は変化して、ターゲット特徴量の最も最適な結果を生成する条件が検出されます。たとえば、家屋の価格の場合の固定特徴量には、建築年、基礎の種類、立地などがあります。

また、このページを使用して、「custom_id」フィールドにデータポイントの名前を入力します。データポイントには、(固定および可変特徴量設定に基づく)アプリのシミュレーションの結果が含まれます。さまざまな固定および可変特徴量を使用する複数のシミュレーションで複数のデータポイントを比較できます。(バッチ予測でも複数のデータポイントを使用できます。)

  1. データポイントの名前を「custom_id」フィールドに入力します。

  2. 固定フィーチャーの入力値—シミュレーション中に一定のままである値。または、「平均値を使用」を選択して、平均値でフィールドを自動的に入力します。以前にシミュレーションを実行している場合は、ボタンのラベルは「以前使用した値を使用」になります。

すべてのデータを入力した後、データポイントを取得をクリックしてシミュレーションを開始し、ターゲットを最適化します。

最適化シミュレーションの結果

シミュレーションを実行した後、結果がグラフに表示されます。

Y軸はターゲット特徴量の値を示します(1)。X軸はシミュレーションの反復処理を示します(2)。グラフの各ポイントは、実行した各シミュレーションの予測値を表します。

グラフのポイント(データポイント)を選択すると、グラフの下にある特徴量値の比較テーブルが更新されます。このテーブルには、個々の実行結果における最適値と、その計算に使用された各可変特徴量の選択された値が表示されます。

最適値は、ターゲットの最適な結果(設定に応じて最小または最大の値)が最も頻繁に生成された特徴量の値を表します。選択された値は、特定の反復処理で選択した値です。これらの値を使用して、各反復処理で選択された値とアプリで特定された全体で最も最適な値を比較できます。

シミュレーション結果のフィルター

ドロップダウンメニューを使用して、各可変特徴量をフィルターして結果に制約を加えることができます。

カテゴリー特徴量の場合、シミュレーション結果から除外する値の選択を解除します。たとえば、「非常に良い」状態の地下室に投資する必要はないので、その特徴量の値は除外します。数値特徴量の場合、含める値の範囲を絞り込むことができます。

制約を適用すると、グラフが更新されます。グラフの上部にフィルタがリストされ、制約の外にあるすべてのデータポイントがグレーアウトされます。

[ダウンロード]をクリックすると、シミュレーションの結果をCSVとしてダウンロードできます。

同じデータで別のパラメーター設定を使用して追加のシミュレーションを実行する場合、データポイントタブを開いてプロセスを再度実行します。

バッチ予測のシミュレーション

バッチ予測を使用して、複数のデータポイントの最適化された予測を生成することもできます。同じ固定および可変特徴量を使用してシミュレーションが実行されますが、CSVまたはJSON形式で指定した行に基づいて、各反復処理で複数のデータポイントが生成されます。

家屋の価格設定の例では、一軒家ではなく、複数のワンルームアパートを所有して、将来実施できる改修内容に基づいて各戸の販売価格を予測することが考えられます。

設定を構成して、データポイントとデータセットページでバッチ予測タブを選択します。

データポイントを含むファイルを追加します。リンクで説明されているファイル要件が満たされていることを確認してください。

単一の最適化を作成するために使用される「custom_id」ラベルは、バッチ予測に使用する追加のデータセットの列として含めることができます。追加するデータセットには、最初のデータセットと同じ特徴量が含まれている必要があります。

各データセットを追加するたびに、固定および可変特徴量の同じセットを使用して、そのデータセットに対してシミュレーションが実行されます。結果を表示するには、最適化されたデータポイントヘッダーの下にあるデータポイントをクリックします。


更新しました February 22, 2022
Back to top