Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

ワードクラウド

ワードクラウドでは、最も関連度の高い語句がワードクラウド形式で表示されます。テキスト特徴量には、強い反応を示す単語が含まれていることがよくあります。インサイトページまたはリーダーボードのいずれかでワードクラウドを使用します。モデルの各バージョンの動作は同じです。リーダーボードタブを使用してワードクラウドを表示し、個々のモデルを調査します。インサイトページを使用して、プロジェクトの各ワードクラウドへのアクセスおよびワードクラウドの比較を行います。さらに、ワードクラウドはマルチモーダルなデータセット(画像、テキスト、カテゴリーなどが混在するデータセット)でも使用でき、データに含まれるすべてのテキストについて、ワードクラウドが表示されます。

備考

あるモデルのワードクラウドは、データセット全体ではなく、そのモデルのトレーニングに使用されたデータに基づいています。例えば、32%のサンプルサイズでトレーニングされたモデルは、同じ32%の行を反映したワードクラウドになります。

ワードクラウドは以下のモデルタイプでサポートされています。

  • 二値分類:ElasticNet分類子(線形ファミリーモデル)のすべてのバリアント(TinyBERT ElasticNet分類子とFastText ElasticNet分類子を除く)。

  • 多クラス:確率的勾配降下法

  • 連続値:Ridge回帰、 ElasticNet回帰、Lasso回帰

ワードクラウドをクリックしてチャートを表示します。

  • 文字列は、青色から赤色に変化する色スペクトルで表示されます。 青色はnegative効果、赤色はpositive効果を示します。
  • 出現頻度の高い文字列はサイズの大きい文字で表示され、頻度の低いものは小さい文字で表示されます。

ワードクラウドでは、次の操作を行うことができます。

  • 単語にカーソルを合わせるとその単語の係数値(1)が表示されます。
  • 多クラスプロジェクトの場合、クラスを選択ドロップダウン(2)を使用して、ワードクラウドを表示する特定のクラスを選択します。
  • ストップワードをフィルタリングボックス(3)をオンにして、ストップワード(検索から除外できる一般的に使用される用語)を表示から削除します。

DataRobotでの単一文字の「ワード」の処理方法の詳細については、こちらのメモを参照してください。


更新しました February 22, 2022
Back to top