データ準備のリファレンス¶
FAQ¶
データを追加¶
1つのデータセットを複数のユースケースに追加できますか?
はい。 データレジストリを介してユースケースにデータセットを追加すると、データセットとユースケースの間のリンクが確立します。
データセットを削除するにはどうすればよいですか?
ユースケースからデータセットを削除するには、 アクションメニュー > ユースケースから削除をクリックします。 これにより、データソースからユースケースへのリンクのみが削除されることに注意してください。つまり、その特定のユースケースのチームメンバーにはデータセットが表示されなくなりますが、別のユースケースで同じデータセットにアクセスできる場合、なおもデータセットにアクセスできます。 DataRobot Classicの AIカタログからソースデータへのアクセスを制御できます。
現在、ワークベンチでサポートされていないデータ接続を参照および管理するには、どうすればよいですか?
上記にリストされていないデータ接続を管理するには、DataRobot Classicを使用する必要があります。 将来のリリースでは、追加の接続がワークベンチに追加される予定です。
ワークベンチでデータ接続を削除するにはどうすればよいですか?
ワークベンチ内からデータ接続を削除することはできません。既存のデータ接続を削除するには、DataRobot Classicで ユーザー設定 > データ接続に移動します。
保存された資格情報を管理するにはどうすればよいですか?
データ接続用に 保存された資格情報は、DataRobot Classicで管理できます。
データのラングリング¶
外部データソースに操作をプッシュダウンできるようにするには、どのような権限が必要ですか?
選択したデータベースへの「読み取り」アクセス権が必要です。
データがソースから移動される状況はありますか?
はい。データは以下においてソースから移動されます。
- **インタラクティブなラングリングセッション中:データソースの元のテーブルまたはビューからランダムにサンプリングされた10,000行が、プレビューとプロファイリングの目的でDataRobotに取り込まれます。
- ラングリングレシピをパブリッシュした後:レシピをパブリッシュすると、変換がプッシュダウンされ、データソースの入力テーブルやビュー全体に適用されます。 結果の出力は、DataRobotで、スナップショットデータセットとして具体化されます。
ラングリングのインサイトと、DataRobotにデータセットを登録する際に生成される探索的データインサイトはどのように異なりますか?
データのラングリング中に生成されたインサイトは、インタラクティブなラングリングセッション中に使用されたデータソースから取得した、元のデータセットのライブランダムサンプルに基づいています。 行数を調整したり、操作を追加したりするたびに、DataRobotはサンプルを更新し、探索的データ解析を再実行します。
なぜデータをダウンサンプリングする必要があるのでしょうか?
Snowflakeの元のデータのサイズが DataRobotのファイルサイズ要件を満たしていない場合、 自動ダウンサンプリングを設定して、出力データセットのサイズを小さくすることができます。
機能に関する注意事項¶
データを追加¶
データセットを追加する際、以下の点に注意してください。
- DataRobot Classicでデータ接続を削除する必要があります。
- URLのインポートはサポートされていません。
- 現在、プレビューでの画像のサポートはありません。
データのラングリング¶
データのラングリングをする際、以下の点に注意してください。
- プロファイルはカスタマイズできず、サンプルベースのプロファイルに制限されています。
-
ラングリングは以下をサポートしていません。
- 非構造化データ型。
- クエリー型データセット(クエリーから構築されたデータセット)。
-
セルフマネージド:データレジストリのデータセットは20GBまでラングリングできます。
- マネージドSaaS(マルチテナントSaaSおよびAWSシングルテナントSaaSデプロイ):データレジストリのデータセットは100GBまでラングリングできます。
