Skip to content

データ準備のリファレンス

接続機能

以下の表は、ワークベンチで現在利用可能な接続と、それぞれの接続でサポートされている機能の一覧です。

接続 可用性 動的データセット ライブプレビュー ラングリング ソース内マテリアライズ
Snowflake 一般提供
Google BigQuery 一般提供
Databricks 一般提供
AWS S3 一般提供
ADLS Gen2 一般提供
SAP Datasphere プレミアム機能

FAQ

データを追加

1つのデータセットを複数のユースケースに追加できますか?

はい。 データレジストリを介してユースケースにデータセットを追加すると、データセットとユースケースの間のリンクが確立します。

データセットを削除するにはどうすればよいですか?

ユースケースからデータセットを削除するには、 アクションメニュー > ユースケースから削除をクリックします。 これにより、データソースからユースケースへのリンクのみが削除されることに注意してください。つまり、その特定のユースケースのチームメンバーにはデータセットが表示されなくなりますが、別のユースケースで同じデータセットにアクセスできる場合、なおもデータセットにアクセスできます。 DataRobot Classicの AIカタログからソースデータへのアクセスを制御できます。

現在、ワークベンチでサポートされていないデータ接続を参照および管理するには、どうすればよいですか?

上記にリストされていないデータ接続を管理するには、DataRobot Classicを使用する必要があります。 将来のリリースでは、追加の接続がワークベンチに追加される予定です。

ワークベンチでデータ接続を削除するにはどうすればよいですか?

ワークベンチ内からデータ接続を削除することはできません。既存のデータ接続を削除するには、DataRobot Classicで ユーザー設定 > データ接続に移動します。

保存された資格情報を管理するにはどうすればよいですか?

データ接続用に 保存された資格情報は、DataRobot Classicで管理できます。

データのラングリング

外部データソースに操作をプッシュダウンできるようにするには、どのような権限が必要ですか?

選択したデータベースへの「読み取り」アクセス権が必要です。

データがソースから移動される状況はありますか?

はい。データは以下においてソースから移動されます。

  • **インタラクティブなラングリングセッション中:データソースの元のテーブルまたはビューからランダムにサンプリングされた10,000行が、プレビューとプロファイリングの目的でDataRobotに取り込まれます。
  • ラングリングレシピをパブリッシュした後:レシピをパブリッシュすると、変換がプッシュダウンされ、データソースの入力テーブルやビュー全体に適用されます。 結果の出力は、DataRobotで、スナップショットデータセットとして具体化されます。
ラングリングのインサイトと、DataRobotにデータセットを登録する際に生成される探索的データインサイトはどのように異なりますか?

データのラングリング中に生成されたインサイトは、インタラクティブなラングリングセッション中に使用されたデータソースから取得した、元のデータセットのライブランダムサンプルに基づいています。 行数を調整したり、操作を追加したりするたびに、DataRobotはサンプルを更新し、探索的データ解析を再実行します。

なぜデータをダウンサンプリングする必要があるのでしょうか?

Snowflakeの元のデータのサイズが DataRobotのファイルサイズ要件を満たしていない場合、 自動ダウンサンプリングを設定して、出力データセットのサイズを小さくすることができます。

機能に関する注意事項

データを追加

データセットを追加する際、以下の点に注意してください。

  • DataRobot Classicでデータ接続を削除する必要があります。
  • URLのインポートはサポートされていません。
  • 現在、プレビューでの画像のサポートはありません。

データのラングリング

データのラングリングをする際、以下の点に注意してください。

  • プロファイルはカスタマイズできず、サンプルベースのプロファイルに制限されています。
  • 非構造化データ型はサポートされていません。
  • You can only wrangle Data Registry datasets of up to 20GB.