モデリング¶
空間構造が入力データセットに存在する場合、Location AIのモデリング機能強化により、従来の自動化された特徴量エンジニアリングが拡張され、モデルオプションが改善されます。 Location AIは、次のようないくつかのターゲット技法を使用してこれを実現します。
- ロケーション特徴量のジオメトリプロパティの自動化された特徴量エンジニアリング。
- 空間ラグ特徴量からの派生特徴量の作成。
- 空間ホットスポット、コールドスポット、および遷移を特徴付ける特徴量派生。
自動化されたロケーション特徴量エンジニアリング¶
地理空間データの取込み、自動認識、および変換を行うLocation AIの機能は、DataRobotモデルブループリントの強力な機能を解放します。 たとえば、行レベルのジオメトリに関連付けられたジオメトリプロパティを機械学習モデルの強力な予測子として使用できます。 Location AIは、入力ジオメトリのプロパティから特徴量を自動的に派生させることにより、このような地理空間データの可能性を引き出します。 DataRobotは、以下に示すジオメトリプロパティの特徴量を派生させます。
-
MultiPoints
- Centroid
-
Lines/MultiLines
- Centroid
- Length
- 最小外接長方形領域
-
Polygons/MultiPolygons
- Centroid
- Perimeter
- 面
- 最小外接長方形領域
DataRobotの日付特徴量の自動派生と同様に、自動的に派生したジオメトリ特徴量はデータタブ内に親「ロケーション」タイプの特徴量の子特徴量として表示されます。
派生した空間ラグ特徴量¶
空間ラグ特徴量は、DataRobotモデルに空間依存性パターンを通知するためにデータの空間構造(空間自己相関)に関するインサイトを得るために派生されます。 リーダーボードで空間特徴量を含むモデルを検索することによってLocation AI Spatial Neighborhood Featurizer にアクセスします。 モデルを展開してブループリントを表示し、個々のタスクにアクセスします。
Location AIは、空間ラグ特徴量を入力データセットから自動的に派生させるためのいくつかの手法を実装しています。
-
空間ラグ: さまざまな空間ラグと近傍サイズで数値特徴量の平均近傍値を計算するためのk近傍法アプローチ。
-
空間Kernel: 空間Kernel近傍法を使用して空間依存構造を特徴付けます。 この手法は、距離による重み付けが適用されたさまざまなKernelサイズを使用して、すべての数値特徴量の空間依存構造を特徴付けます。
派生したローカル自己相関特徴量¶
Location AIは、近傍特徴量の空間依存構造をキャプチャすることに加えて、空間関連付けのローカルインジケーターを使用して、入力データセット全体のコンテキスト内の空間類似性のホットスポットとコールドスポットをキャプチャします。 Spatial Neighborhood Featurizerは、すべての非ターゲット数値特徴量の関連の近隣指標を計算します。 派生した特徴量は、入力データセット内の局所的な空間依存の相対的な大きさを特徴付けます。 この方法で派生した特徴量は、DataRobotモデルに特にインパクトを与えるローカル空間依存構造を提示するのに役立ち、ホットスポットとコールドスポット、または特徴量値の急激な遷移が存在するモデルの精度を向上させます。