ライブサンプルとのやり取り¶
ラングリングをクリックすると、DataRobotは10000行の均一なランダムサンプルを取得し、そのサンプルについて探索的データインサイトを計算します。これはすべてデータソースに接続している間に行われます。 次に、データセット全体に適用する操作のレシピを作成します。変換は最初にライブサンプルに適用され、正しく行われているかを確認します。 レシピは、パブリッシュできる状態になるとデータソースにプッシュダウンされ、そこで実行されて出力データセットがマテリアライズされます。
ユースケースの次の領域からデータラングラーを起動できます。
- データ接続からデータセットを選択するときは、右上隅のラングリングをクリックします。
- データタブでは、データセットの横にあるアクションメニューから。
- データ探索ページでは、データのアクションドロップダウンから。
ラングリング設定の変更¶
レシピでは、設定を変更して、後で使用できるようにサマリー情報をよりわかりやすくしたり、ライブプレビューに含まれる行数を変更したりできます。
レシピメタデータの編集¶
デフォルトでは、DataRobotはソースデータに基づいて各ラングリングレシピに名前と説明を割り当てますが、この情報を変更して、特定のユースケースに適用しやすくすることができます。
レシピメタデータを編集するには:
-
タイトルまたは説明のいずれかを編集するフィールドにカーソルを合わせます。 次に、フィールドまたは右側の鉛筆アイコンをクリックします。
-
名前または説明を変更します。完了したら、フィールド外または右側のチェックマークをクリックして変更を保存します。
ライブサンプルの設定¶
デフォルトでは、DataRobotはライブサンプルで10000行をランダムに取得しますが、この数とサンプリング方法は、ラングリング設定で変更できます。 取得する行が多いほど、ライブサンプルのレンダリングに時間がかかることに注意してください。
ライブサンプルを設定するには:
-
右側のパネルで設定をクリックし、プレビューサンプルを開きます。
-
サンプリング方法を選択します。 ドロップダウンを使用して、ランダム、最初のN行、または 時系列データのラングリング、日付/時刻のいずれかのサンプリング方法を選択します。
-
ソースデータから取得する行数を指定します。 ライブサンプルに含める行数(10000未満)を入力して、再サンプリングをクリックします。 ライブサンプルが更新され、指定された行数が表示されます。
ライブサンプルを分析¶
データのラングリング中、DataRobotはライブサンプルに対して探索的データ解析を実行して、表レベルおよび列レベルの サマリー統計と 視覚化を生成します。これは、データセットのプロファイリングや、操作を適用する際のデータ品質の問題の認識に役立ちます。 ライブサンプルの操作の詳細は、 探索的データインサイトのセクションを参照してください。

ライブサンプルの高速処理
ライブサンプルの取得とレンダリングにかかる時間を短縮するには、インサイトを表示の横にあるトグルを使用して、特徴量分布チャートを非表示にします。
データタブでのライブサンプルと探索的データインサイトの比較
両方のページには同様のインサイトがありますが、ライブサンプルに表示される行数を指定でき、これはレシピに変換を追加するたびに更新されます。
次のステップ¶
ここから、次のことができます。
続けて読む¶
このページで説明されているトピックの詳細については、以下を参照してください。