Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

データ準備のリファレンス

接続機能

以下の表は、ワークベンチで現在利用可能な接続と、それぞれの接続でサポートされている機能の一覧です。

接続 一般提供またはパブリックプレビュー 動的データセット ライブプレビュー ラングリング ソース内マテリアライズ
Snowflake 一般提供
Google BigQuery 一般提供
Databricks 一般提供
AWS S3 一般提供
ADLS Gen2 パブリックプレビュー

FAQ

データを追加

データレジストリとは何ですか? AIカタログのデータセットが表示されるのはなぜですか?

データレジストリは、ワークベンチでのアセットのカタログです。AIカタログでアクセスできるすべての静的データセットとスナップショットデータセットが表示されます。 データレジストリを介してデータを追加すると、データのソース(AIカタログ)からユースケースへのリンクが作成されます。

1つのデータセットを複数のユースケースに追加できますか?

はい。 データレジストリを介してユースケースにデータセットを追加すると、データセットとユースケースの間のリンクが確立します。

データセットを削除するにはどうすればよいですか?

ユースケースからデータセットを削除するには、 その他のオプション > ユースケースから削除をクリックします。 これにより、データソースからユースケースへのリンクのみが削除されることに注意してください。つまり、その特定のユースケースのチームメンバーにはデータセットが表示されなくなりますが、別のユースケースで同じデータセットにアクセスできる場合、なおもデータセットにアクセスできます。 DataRobot Classicの AIカタログからソースデータへのアクセスを制御できます。

Snowflake以外のデータ接続を参照して管理するにはどうすればよいですか?

非Snowflakeデータ接続を管理するには、DataRobot Classicを使用する必要があります。 将来のリリースでは、追加の接続がワークベンチに追加される予定です。

ワークベンチでデータ接続を削除するにはどうすればよいですか?

ワークベンチ内からデータ接続を削除することはできません。既存のデータ接続を削除するには、DataRobot Classicで ユーザー設定 > データ接続に移動します。

保存された資格情報を管理するにはどうすればよいですか?

データ接続用に 保存された資格情報は、DataRobot Classicで管理できます。

データのラングリング

Snowflakeに操作をプッシュダウンするには、どのような権限が必要ですか?

Snowflakeのアカウントには、選択したデータベースへのreadアクセス権が必要です。

データがソースから移動される状況はありますか?

はい。データは以下においてソースから移動されます。

  • インタラクティブなラングリングセッション中:プレビューとプロファイリングの目的で、元のテーブルまたはSnowflakeビューからランダムにサンプリングされた10,000行がDataRobotに取り込まれます。
  • ラングリングレシピをパブリッシュした後:レシピをパブリッシュすると、変換がソースにプッシュダウンされ、Snowflakeの入力テーブルやビュー全体に適用されます。 結果の出力は、DataRobotで、スナップショットデータセットとして具体化されます。
ラングリングのインサイトと、DataRobotにデータセットを登録する際に生成される探索的データインサイトはどのように異なりますか?

データのラングリング中に生成されたインサイトは、インタラクティブなラングリングセッション中に使用されたデータソースから取得した、元のデータセットのライブランダムサンプルに基づいています。 行数を調整したり、操作を追加したりするたびに、DataRobotはサンプルを更新し、探索的データ解析を再実行します。

なぜデータをダウンサンプリングする必要があるのでしょうか?

Snowflakeの元のデータのサイズが DataRobotのファイルサイズ要件を満たしていない場合、 自動ダウンサンプリングを設定して、出力データセットのサイズを小さくすることができます。

注意事項

データを追加

データセットを追加する際、以下の点に注意してください。

  • DataRobot Classicでデータ接続を削除する必要があります。
  • URLのインポートはサポートされていません。
  • 現在、プレビューでの画像のサポートはありません。

データのラングリング

データのラングリングをする際、以下の点に注意してください。

  • プロファイルはカスタマイズできず、サンプルベースのプロファイルに制限されています。
  • 非構造化データ型はサポートされていません。
  • ライブサンプルは、ランダムサンプリングのみをサポートします。

更新しました April 2, 2024