クラスターインサイト¶
タブ | 説明 |
---|---|
説明 | データセット内の各クラスターを理解し、名前を付けます。 クラスタリングによって、データの潜在的な特徴量を捉えたり、実用的なインサイトを迅速に把握して伝達したり、さらにモデリングするためにデータ内のセグメントを識別したりすることができます。 |
データ内のクラスターを分析するには、 クラスタリングエクスペリメントを構築した後、リーダーボードからモデルを選択し、クラスターインサイトの視覚化を開きます。
備考
クラスターインサイトで計算される特徴量の最大数は100です。特徴量は、モデルのトレーニングに使用された特徴量から、特徴量のインパクト(高~低)に基づいて選択されます。 残りの特徴量(モデルのトレーニングに使用されていないもの)はアルファベット順にソートされます。
次の表は、クラスターインサイトの可視化について説明しています。
要素 | 説明 | |
---|---|---|
1 | 視覚化コントロール | 表示を操作するためのツールを提供します。 |
2 | クラスターと特徴量 | クラスターおよび特徴量の詳細を提供します。これには、特徴量ごとのクラスターの内訳を視覚化し、特徴量の有用性順に並べ替えたリストを表示する機能が含まれます。 デフォルトでは有用な特徴量セットが表示されます。表示を変更するには、コントロールの特徴量セットドロップダウンを使用します。 |
視覚化コントロール¶
トップバーのコントロールを使用して、表示を操作します。
クラスターを選択¶
クラスターの選択を使用して、(エクスペリメントからではなく)視覚化ビューからクラスターを追加または削除します。 視覚化は、1画面につき最大5つのクラスターをサポートします(右端の矢印を使用します)。
+ クラスターを追加をクリックすると、追加のクラスターが表示されます。ゴミ箱 を使用すると、表示からクラスターが削除されます。 クラスターを並べ替えるには、ある位置のクラスターをクリックして、その位置に新しいクラスターを割り当て直します。
クラスターの名前を変更する¶
クラスターが何を表しているかを理解した後に、クラスターの名前を変更することができます。 クラスター名は他のインサイトと予測に反映され、クラスターをさらに分析できます。 クラスターの名前を変更するをクリックし、クラスター名を編集し、完了したら編集を終了するをクリックします。
特徴量セットの変更または作成¶
デフォルトでは、DataRobotは有用な特徴量セットを使用してクラスタリングモデルを構築します。 自動生成されたものやカスタムのものなど、別の特徴量セットを選択して、異なる特徴量のサブセットを探索します。 リストを変更してもモデルには影響せず、表示内容だけが変更されます。ただし、クラスター生成に使用していない特徴量を分析することは、「クラスター間で収入はどのように分布しているのか?」といった質問に答える上で依然として有益です。
新規リストの作成については、 カスタム特徴量セットのリファレンスを参照してください。
検索¶
検索を使用して、各クラスター内の個々の特徴量の配置を表示します。
CSVのダウンロード¶
CSVをダウンロードをクリックして、クラスターのインサイトをダウンロードします。 CSVには、可視化されたクラスターインサイトに表示される情報と、より詳細な特徴量データが含まれます。
より多くの特徴量の表示¶
特徴量は、表示された各クラスターについて、デフォルトで「特徴量のインパクト」に基づいて重要度の高い順から低い順に表示されます。 デフォルトでは、4つの特徴量が表示されます。数字をクリックして、1ページに表示される特徴量の数を調整します。 特徴量のページを移動するには、クラスターの上の右矢印をクリックします。
クラスターと特徴量¶
クラスターは、自然セグメントを形成する類似した特徴量のグループで構成されています。 クラスタリングインサイトの視覚化は、それらのグループがどのように形成されたかを理解するのに役立ちます。 クラスター特徴量の調査の詳細については、リファレンスドキュメントを参照してください。
クラスターは列形式で表示され、各クラスター内の特徴量、特徴量のインパクトスコア、および各特徴量の値が示されます。 視覚化は、クラスター間の特徴量の分布を評価するのに役立ちます。 クラスターのサイズは、 クラスター名の上にパーセンテージで表示されます。 すべてのデータクラスターには、ベースライン比較として100%が含まれています。
- クラスターをスクロールするには、クラスター名の右側にある矢印をクリックします。
- インパクト列名をクリックすると、順序が逆になります。
クラスター内の特徴量にカーソルを合わせると、上位4つの特徴量の詳細が表示されます。
行を展開すると、特徴量のタイプに応じて、クラスター内の追加の特徴量または統計が表示されます。
数値特徴量の場合:
カテゴリー特徴量については、上位4つの特徴量を示すヒストグラムが表示され、それ以外は「Other
」にまとめられます。
すべてのカテゴリーを詳しく見るには、特徴量名の横にある歯車 :fontawesome-gear: をクリックして、高カーディナリティを選択します。 値の上にカーソルを置くと、選択したクラスター内でその値を含むレコード数が表示されます。