データ準備のリファレンス¶
接続機能¶
以下の表は、ワークベンチで現在利用可能な接続と、それぞれの接続でサポートされている機能の一覧です。
接続 | 可用性 | 動的データセット | ライブプレビュー | ラングリング | ソース内マテリアライズ |
---|---|---|---|---|---|
Snowflake | 一般提供 | ✔ | ✔ | ✔ | ✔ |
Google BigQuery | 一般提供 | ✔ | ✔ | ✔ | ✔ |
Databricks | 一般提供 | ✔ | ✔ | ✔ | ✔ |
AWS S3 | 一般提供 | ||||
ADLS Gen2 | 一般提供 | ||||
SAP Datasphere | Premium |
FAQ¶
データを追加¶
データレジストリとは何ですか? AIカタログのデータセットが表示されるのはなぜですか?
データレジストリは、ワークベンチでのアセットのカタログです。AIカタログでアクセスできるすべての静的データセットとスナップショットデータセットが表示されます。 データレジストリを介してデータを追加すると、データのソース(AIカタログ)からユースケースへのリンクが作成されます。
1つのデータセットを複数のユースケースに追加できますか?
はい。 データレジストリを介してユースケースにデータセットを追加すると、データセットとユースケースの間のリンクが確立します。
データセットを削除するにはどうすればよいですか?
ユースケースからデータセットを削除するには、 アクションメニュー > ユースケースから削除をクリックします。 これにより、データソースからユースケースへのリンクのみが削除されることに注意してください。つまり、その特定のユースケースのチームメンバーにはデータセットが表示されなくなりますが、別のユースケースで同じデータセットにアクセスできる場合、なおもデータセットにアクセスできます。 DataRobot Classicの AIカタログからソースデータへのアクセスを制御できます。
現在、ワークベンチでサポートされていないデータ接続を参照および管理するには、どうすればよいですか?
上記にリストされていないデータ接続を管理するには、DataRobot Classicを使用する必要があります。 将来のリリースでは、追加の接続がワークベンチに追加される予定です。
ワークベンチでデータ接続を削除するにはどうすればよいですか?
ワークベンチ内からデータ接続を削除することはできません。既存のデータ接続を削除するには、DataRobot Classicで ユーザー設定 > データ接続に移動します。
保存された資格情報を管理するにはどうすればよいですか?
データ接続用に 保存された資格情報は、DataRobot Classicで管理できます。
データのラングリング¶
Snowflakeに操作をプッシュダウンするには、どのような権限が必要ですか?
Snowflakeのアカウントには、選択したデータベースへのread
アクセス権が必要です。
データがソースから移動される状況はありますか?
はい。データは以下においてソースから移動されます。
- インタラクティブなラングリングセッション中:プレビューとプロファイリングの目的で、元のテーブルまたはSnowflakeビューからランダムにサンプリングされた10,000行がDataRobotに取り込まれます。
- ラングリングレシピをパブリッシュした後:レシピをパブリッシュすると、変換がソースにプッシュダウンされ、Snowflakeの入力テーブルやビュー全体に適用されます。 結果の出力は、DataRobotで、スナップショットデータセットとして具体化されます。
ラングリングのインサイトと、DataRobotにデータセットを登録する際に生成される探索的データインサイトはどのように異なりますか?
データのラングリング中に生成されたインサイトは、インタラクティブなラングリングセッション中に使用されたデータソースから取得した、元のデータセットのライブランダムサンプルに基づいています。 行数を調整したり、操作を追加したりするたびに、DataRobotはサンプルを更新し、探索的データ解析を再実行します。
なぜデータをダウンサンプリングする必要があるのでしょうか?
Snowflakeの元のデータのサイズが DataRobotのファイルサイズ要件を満たしていない場合、 自動ダウンサンプリングを設定して、出力データセットのサイズを小さくすることができます。
注意事項¶
データを追加¶
データセットを追加する際、以下の点に注意してください。
- DataRobot Classicでデータ接続を削除する必要があります。
- URLのインポートはサポートされていません。
- 現在、プレビューでの画像のサポートはありません。
データのラングリング¶
データのラングリングをする際、以下の点に注意してください。
- プロファイルはカスタマイズできず、サンプルベースのプロファイルに制限されています。
- 非構造化データ型はサポートされていません。
- ライブサンプルは、ランダムサンプリングのみをサポートします。