データ取込み¶
DataRobot Location AIを使用すると、次のようなさまざまな経路を通じて既存の地理空間データソースを利用できます。
- ネイティブの地理空間ファイル
- 空間対応データベーステーブル
- 自動認識された空間座標
- ロケーション特徴量の型へのユーザー変換
地理空間データに直接接続すると、地理情報システム(GIS)またはデータ準備ツールでネイティブの地理空間データ形式からエクスポートするために必要な時間とリソースを節約できます。 DataRobot Location AIの非ネイティブ形式の地理空間データを自動的に認識する機能を使用すると、非従来型の地理空間アナリストが空間データを明示的に操作することもできます。
ネイティブの地理空間データ¶
DataRobot Location AIは、以下のネイティブの地理空間データ形式の取込みをサポートしています。
- ESRIシェープファイル
- GeoJSON
- ESRIファイルジオデータベース
- Well Known Text(テーブルの列に埋め込み)
- PostGISデータベース
ネイティブの地理空間ファイル形式は、非空間形式と同じ方法(ドラッグアンドドロップ、URLアップロード、AIカタログの使用など)でDataRobotにアップロードされます。
ESRIシェープファイル¶
ESRIシェープファイルは1990年代後半に作成され、今日でも広く使用されている一般的なネイティブ地理空間形式です。 シェープファイルは、最低限、.shp
、.shx
、および.dbf
拡張子が必要なマルチファイル形式です。 マルチファイル形式という性質上、DataRobot Location AIは、これらの拡張子、および追加の.prj
拡張子(座標参照系(CRS)を記述)を含むZIPアーカイブファイルを受け入れます。
GeoJSON¶
GeoJSONは最近の地理空間ファイル形式で、Webマッピングアプリケーションでよく使用され、インターネット技術標準化委員会(IETF)によって仕様として提出されています。 ESRIシェープファイルとは異なり、GeoJSONは単一のファイル形式で、ファイル自身の中で座標参照系(CRS)を記述します。
ESRIファイルジオデータベース¶
ESRIファイルジオデータベースは、ネストされたフォルダー構造を介してデータベースを近似する独自の形式です。 Location AIは、拡張子.gdb.zip
のZIPアーカイブ内のファイルジオデータベースディレクトリを読み取ることができます(ファイル塩デーtベースディレクトリには拡張子.gdb
が付いています)。 Location AIは、ジオデータベースファイルの最初のレイヤーを読み取ります。
Well Known Text¶
Well Known Text(WKT)は、Open Geospatial Consortium(OGC)のSimple Feature Access仕様で記述されているマークアップ言語です。 WKTはベクトル空間データジオメトリの汎用表現であり、行に関連付けられたジオメトリを説明する機能としてDataRobot AutoMLの既存のファイルタイプのいずれかで利用できます。 下の図の「WKT」列を参照してください。
PostGISデータベース¶
PostGIS取込みの設定は、非空間データベースと同じワークフローに従います。
ロケーションデータの自動認識¶
ネイティブの地理空間データの取込みに加えて、DataRobot Location AIは、非空間形式のロケーションデータを自動的に検出できます。 列名にlatitude およびlongitudeが含まれ、以下の形式の値が含まれる場合、DataRobot Location AIではロケーション特徴量が自動的に認識されます。
-
小数度
-
度分秒
- -46° 37′ 59.988″ および -23° 33′
- 46.63333W および 23.55S
- 46*37′59.98"W および 23*33′S
- W 46D 37m 59.988s および S 23D 33m
DataRobotのデータページでは、自動認識された空間座標の結果として作成されたジオメトリ特徴量にアイコンが表示されます。
ロケーションデータへのユーザー変換¶
非空間ファイル形式に埋め込まれた空間座標が認識されない場合でも、DataRobotの特徴量の型変換機能を使用して、ロケーション特徴量を作成できます。 データをロケーション特徴量に変換するには:
-
親座標特徴量の1つに移動して特徴量セットを展開し、機能メニューから特徴量の型の変換を選択します。
-
数値/カテゴリー変換ダイアログで、ロケーション(数値/カテゴリー変換ドロップダウン)を選択します。
-
2つの追加のドロップダウンメニュー(緯度および経度)が表示されます。 既存の特徴量セットから選択して、親座標を指定します。
-
特徴量を作成をクリックします。
新しい特徴量は、親特徴量の後にデータテーブルの新しい行として表示され、ユーザーが作成したことを示すアイコンが表示されます。
ロケーション特徴量の型¶
Location AIは、従来の特徴量の型(数値、カテゴリー、および日付の)に加えて、ロケーション特徴量タイプを追加して、DataRobotモデルで空間データを明示的に扱います。
ロケーション特徴量の型は、OGC Simple Feature Access仕様およびいくつかのマルチパートジオメトリで指定されている2Dジオメトリプリミティブをサポートしています。 これらには、以下のサポートが含まれます。
- ポイント/マルチポイント
- LineString/MultiLineString
- ポリゴン/マルチポリゴン
ロケーション特徴量は、モデル ブループリント、特徴量の有用性の計算、視覚化など、AutoMLワークフロー全体でロケーションデータを処理するDataRobotの機能を向上させます。