データの分析¶
これらのセクションは、DataRobotで作成された結果と可視化を解釈するのに役立ちます。
| トピック | 説明 |
|---|---|
| データ品質評価 | データセットのデータ品質評価の結果を解釈します。 |
| データ品質チェック | 各データ品質チェックの説明と、DataRobotが一般的なデータ品質の問題を検出し、多くの場合、修正するために適用するロジックの説明。 |
| データ取込み後の分析(EDA1) | |
| EDAによるデータ品質の評価 | 探索的データ解析(EDA)の各段階で、データの品質を評価します。 |
| ヒストグラムを使用した特徴量の分析 | 特徴量の値の分布を分析し、外れ値を調査します。 |
| 頻出値の分析 | 特徴量に対して最も頻繁に出現する値と、あまり出現しない値を確認します。 |
| 特徴量の詳細 | ヒストグラム、頻出値チャート、および変換を解釈します。 |
| EDA1 | データのサンプルに基づくサマリー統計が表示されます。 |
| ESDA | マップ上のターゲット、数値、およびカテゴリー特徴量をインタラクティブに視覚化、調査、および集計します。 |
| 大規模データセットの高速EDA | 大規模データセットの高速探索的データ解析(EDA)の概要と、早期ターゲットの選択を適用する方法。 |
| 時間経過チャート | 特徴量の時間の経過に伴う変化の仕方を示す時間を考慮した視覚化を確認します。 |
| モデリング後の分析(EDA2) | |
| EDA2 | EDA1に使用したデータの部分に対してのサマリー統計が表示されますが、プロジェクトのホールドアウトデータにも含まれる行およびターゲットがN/Aである行は除外されます。 |
| 特徴量の関連性 | 特徴量の相関を解釈します。 |
| 取込みと変換にデータパイプラインを使用 | DataRobot内でデータセットをカタログ化して最新の状態に保ち、実験、バッチ予測、または自動再トレーニングジョブの準備ができるように、再利用可能なデータパイプラインを作成する方法を説明します。 |