データレジストリ¶
データを追加モーダルを開くと、デフォルトではデータレジストリが表示されます。これはデータセットの中心的なカタログであり、AIカタログ内で現在アクセスできるすべての静的データセットとスナップショットデータセットが表示されます。これには、 ローカルファイルからアップロードされたデータセットや、ワークベンチの データ接続が含まれます。 この方法でデータを追加するのは、データセットがすでにモデリングに使用できる場合に適しています。
レジストリからデータセットを追加すると、ユースケースからそのデータセットのソースへのリンクが作成されます。つまり、データセットはユースケースと1対多の関係を持つことができるので、データセットを削除すると、リンクだけが削除されます。データセットから作成されたエクスペリメントは影響を受けません。
その他の重要情報については、関連する 注意事項を参照してください。
データセット追加¶
DataRobotに登録済みの静的データセットまたはスナップショットデータセットを追加できます。
プレビュー
ワークベンチでの動的データセットのサポートは、デフォルトではオンになっています。
この機能が有効になっている場合:
- データ接続を介して追加されたデータセットは、データレジストリとユースケースに動的データセットとして登録されます。
- 接続を介して追加された動的データセットは、データレジストリで選択できます。
- DataRobotは、動的データセットの探索的データインサイトを表示するときに、新しいライブサンプルを取得します。
機能フラグ: ワークベンチで動的データセットを有効にする
データセットを追加するには:
-
データレジストリで、表示するデータセットの左側にあるボックスを選択します。
-
(オプション)プレビューをクリックして、データセットがユースケースの目的に適しているかどうかを判断するために、 データセットをプレビューします。
-
右上隅のユースケースに追加をクリックします。
ワークベンチは、ユースケースのデータタブを開きます。
データセットをプレビュー¶
スナップショットプレビューを表示すると、データセットがユースケースに適したものであることを追加する前に確認できます。
データセットをプレビューするには:
-
データレジストリで、表示するデータセットの左側にあるボックスを選択し、右上隅のプレビューをクリックします。
-
特徴量ボタンおよびデータプレビューボタンを使用してデータセットを分析します。
データセット内の各特徴量の特徴量名、タイプ、一意の値の数、および欠損値の数を一覧表示します。
元のデータテーブルのランダムサンプル(最大1MB)を表示します。
-
データセットがユースケースに適しているかどうかを判断してから、次のいずれかを実行します。
- ユースケースに追加をクリックして、データセットをユースケースに追加します。
- データセット名の下にあるブレッドクラムでデータレジストリをクリックして、データレジストリに戻ります。
次のステップ¶
ここから、次のことができます。
続けて読む¶
このページで説明されているトピックの詳細については、以下を参照してください。