ワーカーキュー¶
アプリケーションの右側のパネルに表示されるワーカーキューでは、EDA1およびEDA2のステップの監視、ターゲットの選択、およびモデル構築に使用するワーカーの数の設定を行います。
モデリングを完了した後、次のレベルでオートパイロットを再実行し(「さらなる精度を獲得します」)、モデリングの環境を設定してプロジェクトを再実行すると、プロジェクトのホールドアウトを解除できます。
パネルの最小化および拡張
マウスをワーカーキューとリーダーボードの間のエッジに移動させると矢印が表示され、それをクリックするとキューを拡張または最小化することができます。
ワーカーを追加できない場合は、トラブルシューティングワーカーのセクションをご覧ください。
ワーカーの理解¶
DataRobotでは、以下に示すようなジョブのタイプに応じて異なるタイプのワーカーが使用されます。
- データをアップロード中
- EDAの計算
- モデルのトレーニング
- インサイトの作成
データの管理およびEDAの計算を行うワーカーは、組織全体で共有されます。 これらのワーカーは、全ての共有サービスの高可用性を実現するためのリソースプールです。 一方、モデリングワーカーは、管理者によって各ユーザーに割り当てられます。 次のセクションでは、モデリングおよび予測ワーカーのワーカーキューについて説明します。
構築処理の進行状況の監視¶
構築を開始すると、ワーカーキューに実行中や保留中のモデルがすべて表示されます。
タスクの送信メカニズムに基づくキュー優先順位付けタスク。 「有用性の高い」ジョブが最初に処理されます。オートパイロットによって送信されたすべてのタスクは低優先度(バックグラウンド)に割り当てられます。 その他のすべてのタスク(オートパイロットによって開始されなかったタスク)にはデフォルトの優先度が割り当てられます。 たとえば、ユーザーが送信したタスク(特徴量のインパクトの比較など)は次の使用可能なワーカーによって処理されます。オートパイロットでモデルの構築が終了するのを待つ必要はありません。
ワーカーキューでは次の操作を行うことができます。
表示 | 説明 |
---|---|
進捗の表示 | 各モデルの構築中にサマリーと詳細情報を表示します。 |
ワーカーの調整 | 現在の構築に使用されている同時ワーカー数を調整します。 |
処理の一時停止 | キューを一時停止するとともに処理中のモデルを完了させます。 |
処理を停止 | キューを停止し、すべての処理モデルとキューモデルをプロジェクトから削除します。 |
構築の並べ替え | キュー内のモデルを並べ替えます。 |
構築のキャンセル | スケジュールされている構築をキューから削除します。 |
モデル実行の再開 | 別の構築条件でモデルを再度実行するためのオプションを選択します。 |
何らかの理由によってワーカーまたは構築が失敗したら、キューの一番下にエラーイベントとしてリスト表示し、記録します。 さらに、イベントはダイアログに表示および記録され、プロジェクトの管理インベントリから使用できます。
進捗の表示¶
ワーカーキューは、処理中のモデルとキュー内のモデルの2つに分けられます。 処理中のモデルについては、CPUおよびRAM使用状況のライブレポートが表示されます。
キュー内モデルリストの表示を最大化または最小化するには、キュー名の隣にある矢印をクリックします。
ワーカー数の調整¶
DataRobotがモデル構築に使うワーカーの数を、管理者が設定した最大数まで調整できます。 プロジェクトが自分と共有されていて、所有者に高次の割り当てがある場合、許可されたワーカーの合計数には、所有者の割り当てが表示されます(必ずしも自分に許可されている数であるとは限りません)。 ワーカーの数を増減させるには、オレンジ色の矢印をクリックします。
ワーカーキューの一時停止¶
ワーカーキューを一時停止するには、キューの上にある一時停止マーク(縦の2本線)をクリックします。 一時停止後は、マークが再生マーク(矢印)に変わります。
キューを一時停止しても、処理中のモデルについては処理が続行されます。 これらのモデルが完成すると、ワーカーはキュー内の次のモデルの構築を始められる状態になります。 キューの一時停止を解除するまで、この順番は空いたままになります。 モデルの構築を再開するには再生矢印をクリックします。
ワーカーキューの停止¶
ワーカーキューを停止するには、キューの上部にある「X」印をクリックします。
キューを停止すると、進行中あるいはキューに入っているすべてのモデルが直ちに削除され、モデリングプロセスが終了します。
ワーカーの並べ替え¶
特定のモデルのトレーニングに優先順位を付けるために、キュー内のモデルを新しい位置にドラッグアンドドロップできます。
ジョブが依存関係をトリガーする場合、モデルの依存関係が初期モデルの後にトレーニングされるようにキューを並べ替えることはできません。 並べ替えようとすると、モデルはキュー内の元の位置に戻ります。 たとえば、ジョブA
を起動すると、2つの依存関係であるジョブB
とC
が作成されます。 ジョブA
を構築するためにはジョブB
とC
が必要なため、ワーカーキューでジョブA
を先に移動させることはできません。
なお、実行中のモデルを並べ替えることはできません。
ワーカーのキャンセル¶
処理中モデルまたはキュー内モデルを削除するには、モデル名の隣にあるX印をクリックします。 実行中のモデルはただちにキャンセルされ、キュー内のモデルはキューから削除されます。
モデル構築の再開¶
構築が完了したとき、または一時停止したときに、同じデータを使用して新しい構築を開始することができます。 次のいずれかからモデル作成を再開します。
- モデリング設定の構成リンクを使用したワーカーキュー
-
データページの特徴量セットタブ。
リンクをクリックすると、使用する特徴量を選択できるダイアログボックスが開きます。 セットの選択と再トレーニングを行う際は、これらの注意事項に留意してください。 次に、オートパイロットを再開をクリックして新しいモデル作成を開始します。
ワーカーのトラブルシューティング¶
ワーカー数を増やしたいと思っていたのにできない場合、その理由は以下のように考えられます。
- ワーカー数の上限に達している。
- ワーカーが共有プールの一部である。
- ワーカーが他のプロジェクトで使われている。
ワーカーの上限¶
モデリングワーカーの割り当ては、管理者によって設定されます。 各ワーカーがモデリングの仕事を処理します。 このジョブの数は、クラスター内のすべてのプロジェクトに適用され、モデルを構築する複数のブラウザーウィンドウはすべて個人のワーカー数の一部となり、ウィンドウが増えればワーカーが増えるというわけではありません。
共同管理されたワーカー¶
組織に所属している場合、ワーカーの共有管理を行うことがあります。 この場合、ワーカーは先入れ先出し方式で、組織内のすべてのユーザーに対する全ジョブに割り当てられます。 組織内の他のユーザーのジョブが完了するのを待つ必要はないかもしれませんがあなたと彼らのジョブは、キューでシード値が与えられ、受けとられたときに処理されます。
使用中のワーカー¶
ワーカー数を増やせるはずなのに増やせない場合、たとえば「YワーカーのうちXを使っている」など、デバッグのために考慮すべき値は2つあります。 Yが期待より低い場合は、ワーカー制限と組織制限を確認します。 Xが期待より少ない場合は、ワーカーが組織内の他のプロジェクトまたはユーザーに割り当てられているかどうかを確認します。
プロジェクト内のワーカーの使用を確認するには、プロジェクトの管理インベントリを実行し、キューのジョブを探します。 以下で確認できます。
-
インベントリ内のアイコンおよび数。
-
フィルタープロジェクトを使用し、実行またはキューを選択した結果のリスト。
キューに入ったジョブでプロジェクトを見つけた場合、ワーカーキューの処理を停止することができます。
- インベントリ内のプロジェクトをクリックして、それをアクティブなプロジェクトにします。
-
ワーカーキューでXアイコンをクリックして()、すべてのタスクを削除します。 これは、進行中またはキュー内のモデルをすべて削除します。
プロジェクトを停止することもできます。 ワーカーがアクティブなジョブを完了すると、他のプロジェクトからジョブを手に入れることができるようになります。
備考
インベントリ内のアクションメニューを使用してプロジェクトを削除した場合、そのすべてのワーカージョブは自動的に終了されます。