データのラングリング¶
ビデオ:データラングリング
DataRobotのラングリング機能により、モデリング用のデータへのアクセスと変換をシームレスでスケーラブル、かつセキュアな方法で行うことができます。 ワークベンチでは、「ラングリング」はソースでデータクリーニングを実行し、データソースの計算環境と分散アーキテクチャを活用するための視覚的なインターフェイスです。
ラングリングをクリックすると、DataRobotは10000行の均一なランダムサンプルを取得し、そのサンプルについて探索的データインサイトを計算します。これはすべてデータソースに接続している間に行われます。 次に、データセット全体に適用する操作のレシピを作成します。変換は最初にライブサンプルに適用され、正しく行われているかを確認します。 レシピは、パブリッシュできる状態になるとデータソースにプッシュダウンされ、そこで実行されて出力データセットがマテリアライズされます。
DataRobotでデータをラングリングする理由
- ワークベンチに完全に統合 適切なデータセットを見つけて、変換を適用し、データセットに対する変換の影響を、リアルタイムで1か所で確認できます。
- プッシュダウン クラウドデータウェアハウスやレイクのスケールを活用できます。
- セキュア データ移動が制限されるため、結果の迅速化、パフォーマンスの向上、およびセキュリティの強化につながります。
このセクションでは、以下のトピックについて説明します。
トピック | 内容... |
---|---|
レシピの構築 | データソースから移動せずにモデリング用のデータをインタラクティブに準備するためのレシピを構築します。 |
レシピのパブリッシュ | データソースに変換をプッシュダウンし、出力データセットを生成するためのレシピをパブリッシュします。 |
更新しました March 3, 2024
このページは役に立ちましたか?
ありがとうございます。どのような点が役に立ちましたか?
より良いコンテンツを提供するには、どうすればよいでしょうか?
アンケートにご協力いただき、ありがとうございました。