データセット¶
データセットタブには、自分と他のチームメンバーが選択したユースケースに現在リンクされているすべてのデータセットが一覧表示されます。 このタブにアクセスするには、ユースケースを開き、データセットをクリックします。
このタブでは、次の操作を行うことができます。
要素 | 説明 | |
---|---|---|
1 |
新規追加 | データセット、エクスペリメント、ノートブックをユースケースに追加するか、新しいユースケースを作成します。 |
2 |
検索 | 特定のデータセットを検索します。 |
3 |
ソート | データセット列を並べ替えます。 |
4 |
その他のオプション | Click More options to interact with a dataset:
|
View exploratory data insights¶
While a dataset is being registered in Workbench, DataRobot also performs exploratory data analysis (EDA1)—analyzing and profiling every feature to detect feature types, automatically transform date-type features, and assess feature quality. 登録が完了したら、EDA1の計算中に明らかになった情報を探索できます。
パブリックプレビュー
Support for dynamic datasets in Workbench is on by default.
When this feature is enabled:
- Datasets added via a data connection will be registered as dynamic datasets in the Data Registry and Use Case.
- Dynamic datasets added via a connection will be available for selection in the Data Registry.
- DataRobot will pull a new live sample when viewing Exploratory Data Insights for dynamic datasets.
機能フラグ: ワークベンチで動的データセットを有効にする
To view exploratory data insights:
- ユースケースで、データセットタブに移動します。
-
表示するデータセットの横にあるその他のオプションアイコンをクリックして、探索を選択します。 または、データセット名をクリックしてインサイトを表示します。
-
データセット内の各特徴量に対して、 ヒストグラムやサマリー統計など、さまざまな 特徴量の詳細が表示されます。
-
特定の特徴量をドリルダウンするには、上部にあるヒストグラムチャートをクリックします。
View wrangling recipe SQL¶
If you performed wrangling on a registered dataset, you can see the final compiled form of the operations executed by the cloud data platform after pushdown. To view the SQL queries executed by the cloud data platform, select the dataset and click Recipe SQL.
特徴量セット¶
パブリックプレビュー
Support for feature lists in Workbench is on by default.
Feature flag: Enable Feature Lists in Workbench Preview
After adding a dataset to your Use Case, DataRobot generates feature lists as part of EDA. Feature lists control the subset of features that DataRobot uses to build models and make predictions. Each model has a feature list associated to it.
You might want to use feature lists to:
- Remove features that cannot be used in the model for any reason, for example, a feature that is causing target leakage.
- Make predictions faster by removing unimportant features (i.e., onces that don't improve the model's performance).
You can use one of the automatically created lists—Informative and Raw—or create a custom feature list.
View feature lists¶
Before setting up an experiment, use exploratory data insights to explore different feature lists before choosing the appropriate one to use for modeling.
To explore insights for a feature list:
-
In the Datasets tab, click the More options icon next to the dataset you want to view and select Explore. Alternatively, click the dataset name.
-
To access your feature lists, click the dropdown at the top of the page and select an available feature list. The preview updates to show only the features in the selected list.
特徴量セットを作成¶
To create a custom feature list:
-
While exploring a dataset, click the dropdown at the top of the page and select + New feature list. This opens the Features view.
-
Select the box next to each feature you want to include in your custom list. Then, click Create feature list.
-
Enter a name and description (optional) for the new feature list.
-
変更を保存をクリックします。 You can now access the new feature list in the dropdown.
次のステップ¶
ここから、次のことができます。