データ¶
データレジストリは、NextGenでデータセットを管理するための一元的なハブであり、データを簡単に検索、共有、探索、再利用することができます。 レジストリに直接追加したデータセット、ユースケースにリンクしたデータセット、他のユーザーと共有したデータセット、または自分がメンバーになっているユースケースに他のユーザーが追加したデータセットがここに表示されます。 データレジストリでは、セキュリティ、コンプライアンス、一貫性を確保しながら、ビジネス上の問題への対処に必要なデータに簡単にアクセスできます。
データレジストリは、2つの主要な機能で構成されています。
- 取込み:データはDataRobotにインポートされ、プラットフォーム全体で使用できるようにサニタイズされます。
- ストレージ:再利用可能なデータアセットは保存、アクセス、および共有され、プロジェクトを共有せずにデータを共有できるため、データ重複のリスクとコストを削減できます。
データレジストリはまた、データのセキュリティとガバナンスをサポートし、レジストリへの選択的な追加、ロールベースの共有、監査証跡を通じて、問題を軽減し、モデルの導入を迅速化します。
以下のトピックでは、データページでデータを操作する方法について説明します。
トピック | 説明 |
---|---|
データを追加 | データ接続、ローカルファイル、またはURLを使用して、DataRobotにデータをインポートします。 |
データアセットの管理 | データページからデータを表示、共有、削除します。 |
レジストリのデータを探索 | 個々のデータセットついて、データセットのプレビュー、メタデータ、インサイト、バージョン履歴、関連アクティビティを確認します。 |
機能に関する注意事項¶
データレジストリのページでは、以下はサポートされていません。
- Composable MLのブループリントの保存と編集。
- Spark SQLによるデータ準備。
- 時系列データセットのデータ準備。
更新しました 2025年3月12日
このページは役に立ちましたか?
ありがとうございます。どのような点が役に立ちましたか?
より良いコンテンツを提供するには、どうすればよいでしょうか?
アンケートにご協力いただき、ありがとうございました。