Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

データセット

データセットタブには、自分と他のチームメンバーが選択したユースケースに現在リンクされているすべてのデータセットが一覧表示されます。 このタブにアクセスするには、ユースケースを開き、データセットをクリックします。

このタブでは、次の操作を行うことができます。

要素 説明
1 新規追加 データセット、エクスペリメント、ノートブックをユースケースに追加するか、新しいユースケースを作成します。
2 検索 特定のデータセットを検索します。
3 ソート データセット列を並べ替えます。
4 その他のオプション データセットを操作するには、その他のオプションをクリックします。
  • 探索探索的データインサイトを表示します。
  • ラングリング / ラングリングを続行:データ接続から取得したデータセットについて、 データラングリングを実行します。
  • モデリングを開始:データセットを使用してエクスペリメントを設定します。
  • ユースケースから削除:ユースケースからデータセットを削除し、チームメンバーのアクセス権も削除します。 データセットは引き続き データレジストリから使用できます。

探索的データインサイトの表示

データセットがワークベンチに登録されている間、DataRobotは探索的データ解析 (EDA1)も実行します。つまり、すべての特徴量を解析してプロファイリングし、特徴量型の検出、日付型特徴量の自動変換、特徴量の品質評価を行います。 登録が完了したら、EDA1の計算中に明らかになった情報を探索できます。

パブリックプレビュー

ワークベンチでの動的データセットのサポートは、デフォルトではオンになっています。

この機能が有効になっている場合:

  • データ接続を介して追加されたデータセットは、データレジストリとユースケースに動的データセットとして登録されます。
  • 接続を介して追加された動的データセットは、データレジストリで選択できます。
  • DataRobotは、動的データセットの探索的データインサイトを表示するときに、新しいライブサンプルを取得します。

機能フラグ: ワークベンチで動的データセットを有効にする

探索的データインサイトを表示するには:

  1. ユースケースで、データセットタブに移動します。
  2. 表示するデータセットの横にあるその他のオプションアイコンをクリックして、探索を選択します。 または、データセット名をクリックしてインサイトを表示します。

  3. データセット内の各特徴量に対して、 ヒストグラムやサマリー統計など、さまざまな 特徴量の詳細が表示されます。

  4. 特定の特徴量をドリルダウンするには、上部にあるヒストグラムチャートをクリックします。

ラングリングレシピSQLの表示

登録済みデータセットでラングリングを実行した場合、プッシュダウン後にクラウドデータプラットフォームによって実行された操作の最終的なコンパイル形式を確認できます。 クラウドデータプラットフォームによって実行されたSQLクエリーを表示するには、データセットを選択してレシピSQLをクリックします。

特徴量セット

パブリックプレビュー

ワークベンチでの特徴量セットのサポートは、デフォルトではオンになっています。

機能フラグ:ワークベンチのプレビューで特徴量セットを有効にする

データセットをユースケースに追加した後、DataRobotは EDAの一部として特徴量セットを生成します。 特徴量セットは、DataRobotでモデルの構築と予測に使用する特徴量のサブセットを制御します。 各モデルには特徴量セットが関連付けられています。

特徴量セットを使用して、次のようなことができます。

  • ターゲットリーケージの原因になっている特徴量など、何らかの理由でモデルで使用できない特徴量を削除する。
  • 有用でない特徴量(モデルのパフォーマンスを向上させない特徴量)を削除して、予測を高速化する。

自動作成された特徴量セットのいずれか(有用な特徴量、元の特徴量)を使用するか、 カスタム特徴量セットを作成できます。

特徴量セットの表示

エクスペリメントを設定する前に、探索的データインサイトを使用してさまざまな特徴量セットを探索してから、モデリングに使用する適切な特徴量セットを選択します。

特徴量セットのインサイトを探索するには:

  1. データセットタブで、表示したいデータセットの隣にあるその他のオプションアイコンをクリックし、探索を選択します。 または、データセット名をクリックします。

  2. 特徴量セットにアクセスするには、ページ上部にあるドロップダウンをクリックし、使用可能な特徴量セットを選択します。 プレビューが更新され、選択したセットの特徴量だけが表示されます。

特徴量セットを作成

カスタム特徴量セットを作成するには:

  1. データセットの探索中に、ページ上部にあるドロップダウンをクリックし、+ 新しい特徴量セットを選択します。 特徴量ビューが開きます。

  2. カスタムセットに含めたい各特徴量の横にあるボックスを選択します。 次に、特徴量セットを作成をクリックします。

  3. 新しい特徴量セットの名前と説明(任意)を入力します。

  4. 変更を保存をクリックします。 これで、ドロップダウンで新しい特徴量セットにアクセスできるようになりました。

次のステップ

ここから、次のことができます。


更新しました February 6, 2024