Skip to content

データレジストリ

When you open the Add data modal, by default, DataRobot displays the Data Registry, a central catalog for your datasets that lists all static, snapshot, and dynamic datasets added to the [Data tab in Registry]{0}—either added directly to the Data Registry or added to a Use Case, which is then registered in the Data Registry.

レジストリからデータセットを追加すると、ユースケースからそのデータセットのソースへのリンクが作成されます。つまり、データセットはユースケースと1対多の関係を持つことができるので、データセットを削除すると、リンクだけが削除されます。データセットから作成されたエクスペリメントは影響を受けません。

重要な追加情報については、関連する注意事項を参照してください。

データセット追加

DataRobotに登録済みの静的データセットまたはスナップショットデータセットを追加できます。

プレビュー

ワークベンチでの動的データセットのサポートは、デフォルトではオンになっています。

この機能が有効になっている場合:

  • データ接続を介して追加されたデータセットは、データレジストリとユースケースに動的データセットとして登録されます。
  • 接続を介して追加された動的データセットは、データレジストリで選択できます。
  • DataRobotは、動的データセットの探索的データインサイトを表示するときに、新しいライブサンプルを取得します。

機能フラグ: ワークベンチで動的データセットを有効にする

データセットを追加するには:

  1. データレジストリで、表示するデータセットの左側にあるボックスを選択します。

  2. (オプション)プレビューをクリックして、データセットがユースケースの目的に適しているかどうかを判断するために、 データセットをプレビューします。

  3. 右上隅のユースケースに追加をクリックします。

    ワークベンチは、ユースケースのデータタブを開きます。

データセットをプレビュー

スナップショットプレビューを表示すると、データセットがユースケースに適したものであることを追加する前に確認できます。

データセットをプレビューするには:

  1. データレジストリで、表示するデータセットの左側にあるボックスを選択し、右上隅のプレビューをクリックします。

  2. 特徴量ボタンおよびデータプレビューボタンを使用してデータセットを分析します。

    データセット内の各特徴量の特徴量名、タイプ、一意の値の数、および欠損値の数を一覧表示します。

    元のデータテーブルのランダムサンプル(最大1MB)を表示します。

  3. データセットがユースケースに適しているかどうかを判断してから、次のいずれかを実行します。

    • ユースケースに追加をクリックして、データセットをユースケースに追加します。
    • データセット名の下にあるブレッドクラムでデータレジストリをクリックして、データレジストリに戻ります。

続けて読む

このページで説明されているトピックの詳細については、以下を参照してください。