Location AI¶
DataRobot Location AIは、AutoMLワークフロー全体で地理空間分析のサポートを追加します。 これらのツールと手法は、以下の方法でユーザーがモデリングワークフローを改善するのに役立ちます。
- 一般的な地理空間形式をネイティブに取り込む
- 非空間形式の地理空間座標を自動的に認識する
- 探索的空間データ分析(ESDA)の許可
- 空間的に明示的なモデリングタスクによるモデルブループリントの強化
- モデリング前後のインタラクティブマップを使用した地理空間データの視覚化
- モデルの空間パターンのインサイトの取得
DataRobotのLocation AIは、標準のAutoMLワークフローを拡張して、広範囲の地理空間問題をキャプチャします。
その他の重要情報については、関連する注意事項を参照してください。
これらのセクションでは、以下の内容について説明します。
機能に関する注意事項¶
Location AIを使用する際には、以下のロケーション、ビジュアライゼーション、モデリングのポイントを考慮してください。
ロケーション特徴量¶
Location AIの多くの特徴量は、プライマリーロケーション特徴量で動作します。 データセットには複数のロケーション特徴量を含めることができます。プライマリーロケーション特徴量は、ほとんどの視覚化とモデリングの基礎として使用される特徴量です。
-
プライマリーロケーション特徴量は、データセットの最初のロケーション特徴量に自動的に設定されます。 この選択は、[EDA]ページの[地理空間モデリング]セクションのドロップダウンを使用して変更できます。 オートパイロットが開始した後はプライマリーロケーション特徴量を変更することはできません。
-
ロケーション特徴量は、以下の項目からプロジェクトが作成されるときに自動的に作成されます。
- ネイティブの地理空間データソース(ShapefileやPostGISデータベースなど)に記述されているジオメトリは、ロケーション特徴量として認識されます。
- Well-Known TextまたはWell-Known Binary(16進数)を含むテーブルの列は、ロケーションとして認識されます。
- データセットに「latitude」と「longitude」を含む2つの特徴量がある場合(英語のみ、大文字と小文字は区別されません)および有効なロケーションデータが含まれている場合、これらは自動的にロケーション特徴量に変換されます。 データセット内の該当する最初のペアだけが変換されます。
-
ロケーション列のすべての行は、同じ形状タイプ(ポイント、ライン、ポリゴンなど)である必要があります。
-
緯度と経度のデータを含む特徴量のペアから手動でロケーション特徴量を作成できます。
- これらの特徴量には、有効なロケーションデータが含まれている必要があります。
- 新しい特徴量をモデリングで使用するには、新しく作成した特徴量を特徴量セットに追加する必要があります。 オートパイロットの場合、これは通常、有用な特徴量です。
ビジュアライゼーション¶
Location AIは、探索的空間データ分析(ESDA)およびモデルパフォーマンスのインサイトを探索するためのいくつかの直感的なツールを提供します。
-
地図上のすべてのロケーションを表示するユニークマップビジュアライゼーションは一般的に使用できます。 データセットが十分に大きい場合、データが自動的に集約されてパフォーマンスが向上します。
- 20,000を超える一意のジオメトリ(ポイント、ライン、またはポリゴン)があるデータセット内。
- 合計頂点数が50,000を超えるポリゴンまたはラインのデータセット。
-
位置ごとの精度は連続値プロジェクトでのみ使用できます。 時間外検定(OTV)を使用している場合は使用できません。
モデリング¶
Location AIを使用すると、モデリングブループリントが拡張され、ロケーションによって提供される重要な情報を利用できるようになります。
-
Location AIは、多クラスプロジェクトの探索的空間データ分析(ESDA)に利用できますが、Location AIモデルは、連続値、二値分類、異常検知、クラスタリングのプロジェクトにのみ利用可能となります。
-
時系列はサポートされていません。
-
Spatial Neighborhood Featurizerは、データセットに10,000,000を超える行または500を超える数値列がある場合は実行されません。
-
緯度と経度の特徴量を変換して作成されたポイントロケーション特徴量の場合、元の緯度特徴量と経度特徴量には新しいロケーション特徴量と同じ情報が含まれるので、モデリング中に特徴量セットから除外することができます。
-
Gaussian Process RegressorやEureqaモデルなど、一部のモデリングブループリントはLocation AIをサポートしていません。 一部のブループリントは、オートパイロットで実行できることがあります。また、ロケーション情報を使用しないリポジトリで利用できる場合もあります。
-
スコアリングコードのエクスポートはサポートされていません。