Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

データのインポート

DataRobotへのデータの取込みは、ローカルシステム、URL、Hadoop(Hadoop環境にデプロイされている場合)、および一般的なデータベースやデータレイクへのデータ接続を介して行うことができます。データの取込みプロセスにおいて重要なことは、探索的データ解析(EDA)です。DataRobotでは、データを取込むときと、ターゲットを選択してモデリングを開始するときの2回、EDAを行います。

DataRobotのプラットフォームに直接データをインポートすることも、AIカタログにインポートすることも可能です。このAIカタログは、データおよび関連アセットを操作するために一元化されたコラボレーションハブとして機能します。このカタログを使用することで、データの検索、理解、共有、タグ付け、および再使用をシームレスに行うことができます。以降のセクションでは、データのインポートに関するガイドラインと手順を説明します。

トピック 説明...
データセットの要件 データセットの要件、データ型の定義、ファイル形式とエンコーディング、および特殊な列の取り扱い。
DataRobotへの直接インポート DataRobotでは、データセットファイルのインポート、URLからのインポート、AWS S3からのインポートなど、様々な方法でのインポートが可能です。
AIカタログへのプロジェクトのインポートと作成 AIカタログにデータをインポートして、そこからDataRobotプロジェクトを作成します。カタログでは、SQLを使ったデータ変換や、データのスナップショットのスケジュールや作成を行うことが可能です。
カタログアセット アセットとメタデータを表示、変更、および共有します。
データスナップショットのスケジュール AIカタログでデータスナップショットのスケジュールを設定します。
大規模データセット 大規模なデータセット(Greater Than 10GB)を扱う方法。

更新しました February 22, 2022
Back to top