データプレパレーション¶
データの整合性と質は、精度の高い予測モデル作成の基礎です。 これらのセクションでは、プロジェクトが「ガベージイン、ガベージアウト」の結果に悩まされないようにするためにDataRobotが提供するツールと視覚化について説明します。
DataRobotのラングリング機能では、ノーコードインターフェイスでのデータ準備や特徴量エンジニアリングが可能なため、変換をリアルタイムで確認でき、データからモデルまでの時間を短縮できます。
このセクションでは、以下のトピックについて説明します。
| トピック | 説明 |
|---|---|
| データを追加 | ローカルファイル、データ接続、またはデータレジストリからユースケースにデータセットを追加します。 |
| データ接続 | 外部データソースに接続して、データをシームレスに参照、プレビュー、およびプロファイルし、データラングリングを開始します。 |
| データを探索 | ユースケースにリンクされたデータセットとラングリングレシピを管理し、探索的データインサイトにアクセスします。 |
| データの準備 | データソースから移動せずにモデリング用のデータをインタラクティブに準備して、新しい出力データセットを生成します。 |
| 特徴量を変換する | データ探索ページまたはエクスペリメントから、データセットの特徴量を手動で変換します。 |
| 特徴量探索 | 複数のデータセットを対象として、交互作用ベースで特徴量を作成します。 |
| データ準備のリファレンス | 接続機能や、機能に関する注意事項など、データ準備の参考資料を参照できます。 |