データ準備のリファレンス¶
FAQ¶
データを追加¶
データレジストリとは何ですか? AIカタログのデータセットが表示されるのはなぜですか?
データレジストリは、ワークベンチでのアセットのカタログです。AIカタログでアクセスできるすべての静的データセットとスナップショットデータセットが表示されます。 データレジストリを介してデータを追加すると、データのソース(AIカタログ)からユースケースへのリンクが作成されます。
1つのデータセットを複数のユースケースに追加できますか?
はい、 データレジストリを介してユースケースにデータセットを追加すると、データセットとユースケースの間のリンクが確立します。
データセットを削除するにはどうすればよいですか?
ユースケースからデータセットを削除するには、 その他のオプション > ユースケースから削除をクリックします。 これにより、データソースからユースケースへのリンクのみが削除されることに注意してください。つまり、その特定のユースケースのチームメンバーにはデータセットが表示されなくなりますが、別のユースケースで同じデータセットにアクセスできる場合、なおもデータセットにアクセスできます。 DataRobot Classicの AIカタログからソースデータへのアクセスを制御できます。
Snowflake以外のデータ接続を参照して管理するにはどうすればよいですか?
非Snowflakeデータ接続を管理するには、DataRobot Classicを使用する必要があります。 将来のリリースでは、追加の接続がワークベンチに追加される予定です。
ワークベンチでデータ接続を削除するにはどうすればよいですか?
ワークベンチ内からデータ接続を削除することはできません。既存のデータ接続を削除するには、DataRobot Classicで ユーザー設定 > データ接続に移動します。
保存された資格情報を管理するにはどうすればよいですか?
データ接続用に 保存された資格情報は、DataRobot Classicで管理できます。
データのラングリング¶
Snowflakeに操作をプッシュダウンするには、どのような権限が必要ですか?
Snowflakeのアカウントには、選択したデータベースへのread
アクセス権が必要です。
データがソースから移動される状況はありますか?
はい。データは以下においてソースから移動されます。
- インタラクティブなラングリングセッション中:プレビューとプロファイリングの目的で、元のテーブルまたはSnowflakeビューからランダムにサンプリングされた10,000行がDataRobotに取り込まれます。
- ラングリングレシピを公開した後:レシピを公開すると、変換がソースにプッシュダウンされ、Snowflakeの入力テーブルやビュー全体に適用されます。 結果の出力は、DataRobotで、スナップショットデータセットとして具体化されます。
How do the wrangling insights differ from the exploratory data insights generated when registering a dataset in DataRobot?
データのラングリング中に生成されたインサイトは、インタラクティブなラングリングセッション中に使用されたデータソースから取得した、元のデータセットのライブランダムサンプルに基づいています。 行数を調整したり、操作を追加したりするたびに、DataRobotはサンプルを更新し、探索的データ解析を再実行します。
なぜデータをダウンサンプリングする必要があるのでしょうか?
Snowflakeの元のデータのサイズが DataRobotのファイルサイズ要件を満たしていない場合、 自動ダウンサンプリングを設定して、出力データセットのサイズを小さくすることができます。
注意事項¶
データを追加¶
データセットを追加する際、以下の点に注意してください。
- DataRobot Classicでデータ接続を削除する必要があります。
- URLのインポートはサポートされていません。
- 現在、プレビューでの画像のサポートはありません。
データのラングリング¶
データのラングリングをする際、以下の点に注意してください。
- プロファイルはカスタマイズできず、サンプルベースのプロファイルに制限されています。
- 非構造化データ型はサポートされていません。
- ライブサンプルは、ランダムサンプリングのみをサポートします。