AIカタログのブループリント¶
Composable MLを有効にすると、AIカタログにブループリントを保存する機能を使用できます。カタログから、ブループリントを編集したり、互換性のあるプロジェクトのモデルをトレーニングしたり、または共有したりすることができます。
カタログで利用可能なブループリントのリストは、次のとおりです。
- ユーザーと共有されました。
-
ブループリントタブを介して、リーダーボードまたはリポジトリーから明示的に保存し、AIカタログに追加をクリックしました。
- ブループリントワークショップまたはAPI経由で保存しました。
カタログのブループリントにアクセスする¶
リポジトリまたはリーダーボードからブループリントを保存することを選択した場合、DataRobot はユーザーが名前を変更できるモーダルを表示します。保存が完了すると、カタログを開いてブループリントを操作したり、現在いる場所から編集を開始/続行したりすることができます。
カタログに入ったら、ブループリントをクリックすると、ユーザーが保存したすべてのブループリントのリストが表示されます。
クリックしてブループリントを選択します。拡張されたら、次のタブの1つを選択します。
タブ | 説明 |
---|---|
情報 | ブループリント用の作成情報と変更情報を表示します。さらに、ブループリント名、説明、またはタグを追加または編集できます。 |
ブループリント | ブループリントを追加編集が可能な状態でロードします。ブループリントを使用してモデルをトレーニングすることもできます。 |
コメント | ブループリントにコメントを追加します。ブループリントへのアクセスが許可されたユーザーにはテキストが表示されます。 |
他のカタログアセットと同様に、ブループリントを共有できます。右上隅の共有をクリックして、それを共有し、権限を割り当てる相手を選択します。
プロジェクトブループリントのリンク¶
一部のブループリントは、特定のプロジェクトのみでの使用が意図されたものです。 たとえば、ブループリントを編集する際に、明示的に特徴量を選択し、具体的に選択された特徴量のみに前処理を適用する手順を組み込むことがあるかもしれません。DataRobotの自動化されたプロジェクトリンクを使用すると、ユーザーのブルーブループリントがプロジェクトにリンクされていない場合に、特徴量選択は使用できません。これにより、タスクで特定された列が特定のプロジェクトに関連付けられていることを知らないという問題が回避されます。
下記の例について見てみましょう。
RandomForest Regressorのブループリントで、特定の列を選択して特定の単一または複数の特徴量を参照したい場合は:
追加をクリックして新しいステップを追加します。その後、ブループリントをトレーニングするか、AIカタログに追加することができます。その後、カタログでブループリントを開くと、そのブループリントが特定のデータセット内の特徴量を参照するため、DataRobotはそのプロジェクトに自動的にリンクされています。
次に、リンクされたプロジェクトを変更します(新しいプロジェクトを選択):
DataRobotは、必要な列がデータセット内に存在しないという注意を表示します。
ブループリントを使用するには、最初に列セレクターステップの列を編集する必要があります。プロジェクトへのブループリントのリンクを望まない場合は、プロジェクト選択ドロップダウンでプロジェクトのリンクの解除を使用します。
プロジェクトが自動的にリンクされない場合(プロジェクトの依存関係がないため)、プロジェクトドロップダウンを介して手動でそれへのリンクを設定することができます。
最後に、プロジェクトにリンクされているユーザーブループリントをコピーする場合、リンクもコピーされます。備考:別のプロジェクト(プロジェクトB)内でプロジェクト(「プロジェクトA」)にリンクされているブループリントをトレーニングすることができます。プロジェクトAのブループリントが、プロジェクトBに存在しない特徴量を参照している場合に、DataRobotは注意を表示します。
備考
リンクされたプロジェクト名、およびプロジェクト選択ドロップダウンは、カタログのブループリント > 情報タブからも利用できます。
ブループリントを一括でトレーニングする¶
AIカタログでは、同一のターゲットタイプを共有するユーザーのブループリントに一括アクションを適用することができます。選択したブループリントに共通したターゲットタイプが1つもない場合、DataRobotは、一括トレーニングを行いません。
一括でトレーニングする場合は、AIカタログ > ブループリントを選択し、プロジェクトに適用するブループリントを表示して選択します。ブループリントが選択されると、ブループリントをトレーニングする機能が有効化されます。
備考
複数のターゲットタイプが表示されている場合、ブループリントは表示された各ターゲットタイプをサポートします。
ブループリントをトレーニングするをクリックすると、複数のブループリントのトレーニングモーダルが開きます。
現在のプロジェクトを使用するか、ドロップダウンのプロジェクトに変更します。プロジェクトは選択したブルーブループリントとのターゲットタイプの共通性(この例では多クラス)に基づいたフィルタリングと選択が可能になります。
モーダルのフィールドに記入し、ブループリントをトレーニングするをクリックします。DataRobotは、ブループリントのトレーニングが始まり、リーダーボードで利用可能になると通知します。
ターゲットタイプを選択¶
適切なブループリントの選択を容易にするために、カタログ内のブループリントタブには、ターゲットタイプでブループリントをフィルタリングするためのドロップダウンセレクターが用意されています。
1つまたは複数のタイプを選択すると、選択したタイプの少なくとも1つに一致するブループリントのみがリストされるように表示が変更されます。たとえば、バイナリを選択し、ブループリントがバイナリと多クラスのターゲットタイプを持つ場合、それはリストに含まれます。
ターゲットタイプ検証¶
ブループリントはターゲットタイプが一致するプロジェクトにのみ適用できるため、DataRobotは、選択されたブループリントの検定を実行し、ターゲットタイプに互換性がある場合にのみトレーニングを許可します。たとえば、バイナリのターゲットタイプを持つブループリントを選択して、バイナリのターゲットタイプを持つプロジェクトを選ぶ場合、ユーザーはトレーニングに進むことができます。
有効でない場合、トレーニングは無効になります。