AIカタログアセットの操作¶
AIカタログ内のデータアセットは、次のいずれかとなります。
- テーブル/ビューのマテリアライズ済みスナップショット。これは、DataRobotがデータアセットから取り出し、現在そのコピーをカタログに保持していることを意味します。
- 動的接続。これは、モデリングプロジェクトを作成する際に、データセット全体がデータソースから取り込まれるため、最新のデータを使用できることを意味します。
データがスナップショットされている場合、そのスナップショットは定期的に自動で更新され、データセット系統を保存するために自動的にバージョン管理され、DataRobotの全体的なガバナンス機能を強化できます。
このセクションでは、カタログアセットを操作するためのツールについて説明します。
アセットを追加するには、AIカタログへのプロジェクトのインポートと作成参照してください。
既存のアセットの検索¶
AIカタログ内では、作業するデータアセットをすばやく見つけるためのさまざまなツールを利用できます。以下を実行することが可能です。
検索クエリーボックスを使用してデータセットの検索およびフィルターを行う。さらに、ドロップダウンを使用して、返された結果の順序(デフォルトでは関連性)を変更できます。
1つまたは複数のアセットタイプ(ソース)を選択してフィルターできます。
タグまたはアセット所有者でフィルター:
アセット状態¶
DataRobotは、データセットの状態を示すため、カタログエントリーにバッジを追加します。次のいずれかの方法を選択します。
- 動的:スナップショットがないデータセット
- Spark:Sparkクエリーから構築されたデータセット
- スナップショット: スナップショットがあるデータセット
- 静的: スナップショットがある静的ファイルまたは URLベースのデータセット
アセットの詳細¶
クリックしてアセットを選択すると、DataRobotにアセットの詳細が表示されます。鉛筆アイコン()をクリックすると、アセット名の変更、説明の追加、またはフィルター用のタグの追加を行うことができます。名前または説明を変更するには、ボックス内をクリックしてテキストを入力または削除します。ボックス以外の場所をクリックすると、変更内容が保存されます。タグを追加するには、タグボックス内をクリックして入力します。
DataRobotには、入力した文字に一致する事前定義済みのタグが用意されています。クリックしてタグを選択するか、入力を続けて英数文字の新しいタグを追加します(特殊文字と記号は使用できません)。入力ボックス以外の場所をクリックするか、ドロップダウンをクリックしてタグを追加します。
アセットデータの表示¶
データセットを追加すると、ソースデータがDataRobotに取込まれた後EDA1が実行されます。そしてアセットが登録され、データセットがカタログで使用できるようになります。
プロフィールタブを使用して、データセットの列名と行データをプレビューできます。アンサンブルデータセットに対するSpark SQLステートメントを記述する際の列名の検索や検証に利用できます。プレビューは最大1MBのデータをランダムに抽出したもので、元のデータとは異なる順序で表示される場合があることに備考してください。元のデータをすべて表示するには、データセットのダウンロードオプションを使用します。
データセットをプレビューするには、メインカタログでデータセットを選択し、鉛筆アイコン()をクリックして、そのデータセットの情報にアクセスします(利用可能な場合)。
-
プロフィールタブをクリックして、データセットの内容をプレビューします。
-
列ドロップダウンを使用して、ページに表示する列の数を選択し、スクロールバーを使用して列をスクロールします。さらに、行ドロップダウンを使用して20行単位で使用可能なデータを移動できます。
プロフィールタブでは、データセット内のすべての特徴量の詳細も表示されます。特定の特徴量の詳細を表示するには、画面上で目的の特徴量にスクロールしてクリックします。右側のパネルに一覧表示される特徴量の詳細が更新され、特徴量の統計が反映されます。(これはEDA1のデータに表示される統計と同じです。)
特徴量セットの操作¶
カタログ内のいずれのデータセットの特徴量に対しても、新しい特徴量セットおよび特徴量の変換を作成できます。ツールを使用するには、メインカタログでデータセットを選択し、左側のパネルで特徴量セットを選択します。
特徴量セットを作成すると、プロジェクトの作成時にプロジェクトにコピーされます。その後、特徴量セットドロップダウン(プロジェクトデータリストの上部)からプロジェクトで使用するリストを設定できます。特徴量セットの作成、変更、および詳細については、特徴量セットの操作に関するセクションを参照してください。
特徴量セットリンクからは、variable type(特徴量の型)の特徴量の変換を作成するツールにもアクセスできます。DataRobotは、EDA中に表示される値に基づいてvariable type(特徴量の型)を行いますが、タイプを変更する必要がある場合があります。詳細については、特徴量の変換のドキュメントを参照してください。
特徴量セットを作成するには、以下の手順に従います。
-
特徴量名の左のチェックボックスを使用して、特徴量のセットを選択します。
-
選択内容から特徴量セットを新規作成リンクをクリックします。このリンクは、最初の特徴量を選択するとアクティブになります。
-
表示されるダイアログに新しいリストの名前を入力し、送信をクリックします。新しいリストがドロップダウンで使用可能になります。
作成した特徴量セットは、削除や名前の変更ができます。DataRobotのデフォルト特徴量セットは変更できません。
設定済み関係性の表示¶
DataRobotの特徴量探索機能により、関係性を作成し、含まれるデータセットとデータセット同士の関係の両方を定義することができます。最終的に、これらリンクにより、追加の特徴量が数多く得られます。含まれるデータセットが特徴量探索エンジンによって分析され、特徴量エンジニアリング「レシピ」が決定されます。そのレシピから、トレーニングおよび予測に使用するセカンダリー特徴量が生成されます。確立された関係性はカタログから表示できます。
関係性を表示するには、メインカタログでデータセットを選択し、関係性リンクをクリックして既存の関係性を表示、変更、または削除します。
関係性の詳細を変更する前に、関係性の操作に関する詳細情報を参照してください。
バージョン履歴の表示¶
バージョン履歴リンクを使用して、選択したデータセットのすべてのバージョンを一覧表示します。ステータス列は、スナップショットのステータスを示します。成功の場合は緑、失敗の場合は赤、元のバージョンにスナップショットがない場合はグレーとなります。
バージョンをクリックして選択します。選択すると、そのバージョンからプロジェクトを作成したり、コンテンツをダウンロードまたは削除したりすることができます。
コメントの追加¶
アクセスできるカタログ内のアイテムにコメントリンクと共にコメントを追加できます(ディスカッションをホストすることもできます)。コメント機能はAIカタログ(下図参照)で使用できます。また、リーダーボードのモデルタブやユースケース追跡でも使用できます。コメントを使用すると、以下の操作を行うことができます。
- コメントで他のユーザーにタグを付けます。タグ付けしたユーザーにはDataRobotからメール通知が送信されます。
- 追加したコメントを編集または削除します(他のユーザーのコメントを編集または削除することはできません)。
データセットのダウンロード¶
データセットをダウンロードするには、カタログリストからデータセットを選択します。右上のドロップダウンメニューからデータセットをダウンロード()を選択します。表示されるダイアログでダウンロード先を参照し、[保存]をクリックします。
備考
ダウンロードできるのはスナップショットが作成されているデータセットだけです。さらに、10GBのファイルサイズ制限があります。10GBを超えるデータセットをダウンロードしようとすると失敗します。
資産の共有¶
AIカタログのアセットは、ユーザー、グループ、組織と共有できます。
要素 | 説明 | |
---|---|---|
![]() |
共有を許可 | あなたが共有しているユーザーは、アセットを他のユーザーと共有できます。 |
![]() |
データを使用できる | あなたが共有しているユーザーはデータを使用でいます。データの使用方法はロールによって異なります。 |
![]() |
ユーザーリスト | アセットを共有するユーザーを入力します。 |
![]() |
アクセスレベル | デフォルトではユーザーから選択します。インスタンスでグループと組織が設定されている場合、これらのカテゴリーから選択できます。 |
![]() |
ロール | アセットを共有するユーザー、グループ、または組織のロールを選択します。
|
![]() |
共有 | 共有を選択して操作を実行します。 |
![]() |
次と共有済み | アセットを共有するユーザー、グループ、および組織をその権限設定と合わせて表示します。 |
カタログは、アプリケーション内の他の場所と同じ共有ウィンドウを使用します。一部のフィールドはデータアセットに固有です。
アセットの削除¶
データセットを削除するには、カタログリストからデータセットを選択します。右上のドロップダウンメニューからデータセットの削除()を選択します。確認メッセージが表示されたら、削除をクリックします。