クラスターに対する予測の説明¶
備考
クラスタリング予測の説明は、 XEMPベースの方法を使用してのみ利用できます。 また、時系列クラスタリングモデルでは使用できません。
クラスタリングを使用すると、データ内の自然なセグメントをグループ化して特定し、データセット内の列で明示的にキャプチャされていない潜在的な動作をキャプチャすることで、データを探索できます。 クラスタリングで予測の説明を使用すると、モデルの結果に寄与する最大の要因を明らかにできます。 たとえば、クラスタリングモデルを使用して論理クラスターをデータサンプルに割り当てることで、ターゲットを絞ったマーケティング戦略を構築できます。 その洞察により、規制に準拠したモデルを開発し、クラスタリングモデルの結果を利害関係者に簡単に説明し、影響の大きい要因を特定して、ビジネス戦略に焦点を当てることができます。
予測の説明の解釈¶
クラスタリングモデルの予測の説明は、テキストと画像の説明のサポートなど、 多クラスプロジェクトの場合と非常によく似ています。 このセクションでは、クラスタリング特有の説明の生成と結果の処理について説明します。
クラスターの選択¶
クラスターラベルドロップダウンを使用して、表示するクラスターを選択します。 これらのラベルは、クラスターインサイトタブに表示されるラベルにマッピングされます。 つまり、そこでクラスター名を変更すると、その変更がクラスターラベルセレクターのドロップダウンに反映されます。
DataRobotは、最も多くのデータを含む最大20個のクラスターの予測分布を計算します。 実際の説明は、 ダウンロードからすべてのクラスターで利用できます。
備考
クラスターを選択し、プレビューデータが欠損していることを示すメッセージが表示された場合、特徴量を有効にする前にモデルが構築されたことを示します。 DataRobotはトレーニング中に予測分布を計算するため、プレビューを表示するには説明を再計算する必要があります。
説明を計算する¶
完全なトレーニングデータセットまたは新しいデータのいずれかの説明を計算できます。 プロセスは一般に分類および連続値プロジェクトの場合と同じですが、多クラス固有の違いがいくつかあります。 計算機をクリックすると、次のクラスターの説明を生成するためのモーダルが開きます。
説明の数としきい値を設定します。 説明の計算に使用するクラスターを選択する方法(予測またはクラスターのリスト)を制御するには、クラスター設定を使用します。 デフォルトでは(方法が設定されていない場合)、予測の説明は行の上位予測クラスターを説明します。
予測¶
予測済みを選択すると、指定した数のクラスターの説明を表示できます。 選択すると、予測を計算するクラスターの数を、1から既存のクラスター数(最大10個)の間で入力するように求められます。
返されるクラスターは、特定の特徴量の確率が最も高くランク付けされたクラスターです。 つまり、5つの予測クラスターを要求すると、DataRobotは、行ごとに確率でランク付けされ、各予測クラスターの割り当てと付随する理由を返します。
クラスターのリスト¶
クラスターのリストを選択すると、特定のクラスターのみの説明を表示できます。 クラスターのリストをクリックして、クラスター選択ダイアログをアクティブにします。
説明をダウンロードする¶
計算が完了したら、ダウンロードアイコン()をクリックして、すべてのデータセットの予測および対応する説明をCSV形式でエクスポートします。 クラスの代わりにクラスターを使用して、 多クラスのエクスポートと同じ方法で出力を解釈できます。
デプロイからの説明¶
デプロイから予測を計算すると(デプロイ > 予測 > 予測を作成)、DataRobotは予測済みフィールドとクラスターのリストフィールドをオプションモーダルに追加します。 これらは、 上記で説明されているのと同じように機能します。