Skip to content

データ準備のリファレンス

FAQ

データを追加

1つのデータセットを複数のユースケースに追加できますか?

はい。 データレジストリを介してユースケースにデータセットを追加すると、データセットとユースケースの間のリンクが確立します。

データセットを削除するにはどうすればよいですか?

ユースケースからデータセットを削除するには、 アクションメニュー > ユースケースから削除をクリックします。 これにより、データソースからユースケースへのリンクのみが削除されることに注意してください。つまり、その特定のユースケースのチームメンバーにはデータセットが表示されなくなりますが、別のユースケースで同じデータセットにアクセスできる場合、なおもデータセットにアクセスできます。 DataRobot Classicの AIカタログからソースデータへのアクセスを制御できます。

現在、ワークベンチでサポートされていないデータ接続を参照および管理するには、どうすればよいですか?

上記にリストされていないデータ接続を管理するには、DataRobot Classicを使用する必要があります。 将来のリリースでは、追加の接続がワークベンチに追加される予定です。

ワークベンチでデータ接続を削除するにはどうすればよいですか?

ワークベンチ内からデータ接続を削除することはできません。既存のデータ接続を削除するには、DataRobot Classicで ユーザー設定 > データ接続に移動します。

保存された資格情報を管理するにはどうすればよいですか?

データ接続用に 保存された資格情報は、DataRobot Classicで管理できます。

データのラングリング

外部データソースに操作をプッシュダウンできるようにするには、どのような権限が必要ですか?

選択したデータベースへの「読み取り」アクセス権が必要です。

データがソースから移動される状況はありますか?

はい。データは以下においてソースから移動されます。

  • **インタラクティブなラングリングセッション中:データソースの元のテーブルまたはビューからランダムにサンプリングされた10,000行が、プレビューとプロファイリングの目的でDataRobotに取り込まれます。
  • ラングリングレシピをパブリッシュした後:レシピをパブリッシュすると、変換がプッシュダウンされ、データソースの入力テーブルやビュー全体に適用されます。 結果の出力は、DataRobotで、スナップショットデータセットとして具体化されます。
ラングリングのインサイトと、DataRobotにデータセットを登録する際に生成される探索的データインサイトはどのように異なりますか?

データのラングリング中に生成されたインサイトは、インタラクティブなラングリングセッション中に使用されたデータソースから取得した、元のデータセットのライブランダムサンプルに基づいています。 行数を調整したり、操作を追加したりするたびに、DataRobotはサンプルを更新し、探索的データ解析を再実行します。

なぜデータをダウンサンプリングする必要があるのでしょうか?

Snowflakeの元のデータのサイズが DataRobotのファイルサイズ要件を満たしていない場合、 自動ダウンサンプリングを設定して、出力データセットのサイズを小さくすることができます。

機能に関する注意事項

データを追加

データセットを追加する際、以下の点に注意してください。

  • DataRobot Classicでデータ接続を削除する必要があります。
  • URLのインポートはサポートされていません。
  • 現在、プレビューでの画像のサポートはありません。

データのラングリング

データのラングリングをする際、以下の点に注意してください。

  • プロファイルはカスタマイズできず、サンプルベースのプロファイルに制限されています。
  • ラングリングは以下をサポートしていません。

    • 非構造化データ型。
    • クエリー型データセット(クエリーから構築されたデータセット)。
  • セルフマネージド:データレジストリのデータセットは20GBまでラングリングできます。

  • マネージドSaaS(マルチテナントSaaSおよびAWSシングルテナントSaaSデプロイ):データレジストリのデータセットは100GBまでラングリングできます。