Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

データのエクスポート

多くの場合、処理が完了したら、データを保存場所にエクスポートします。エクスポートモジュールは、パイプラインのデータをCSVとして外部データソースに出力します。

各モジュールタイプのデータ処理制限のセクションを参照してください。

AIカタログエクスポートモジュール

AIカタログエクスポートモジュールは、パイプラインのデータをAIカタログのスナップショットされたデータセットとしてエクスポートします。これにより、複数のソースのデータを結合してクリーニングし、モデルのトレーニングに使用できるデータセットを作成できます。

詳細タブで、エクスポートタイプ(新しいデータセットを作成または既存のデータセットの更新)を選択します。以下のタブを使用して、選択したエクスポートタイプに基づいて設定オプションを表示します。

新しいデータセットを作成し、AIカタログにエクスポートするには、新しいデータセットを作成を選択し、次のオプションを使用してAIカタログエクスポートモジュールを設定します。

オプション 説明
データセット名 AIカタログで作成するデータセットの名前を指定します。
説明 データセットの説明を入力します。
リクエストのタイムアウト(秒) タイムアウトするまでの秒数を指定します。DataRobotでは、タイトアウトに関連するエラーが発生した場合にのみこの値を調整することを推奨します。この場合には、この値を増やしてネットワーク異常を考慮することができます。
タグ データセットに適用するタグを入力します。その後、AIカタログではこれらのタグでフィルターをかけて、データセットを探すことができます。

既存のAIカタログデータセットをスナップショットとして更新するには、既存のデータセットを更新を選択し、次のオプションを使用してAIカタログエクスポートモジュールを設定します。

オプション 説明
データセット AIカタログのデータセットを選択して、更新します。
リクエストのタイムアウト(秒) タイムアウトするまでの秒数を指定します。DataRobotでは、タイトアウトに関連するエラーが発生した場合にのみこの値を調整することを推奨します。この場合には、この値を増やしてネットワーク異常を考慮することができます。

CSV Writerモジュール

CSV Writerモジュールは、パイプラインのデータを区切り文字付き形式で、AWS S3の任意の場所にエクスポートします。

詳細タブでCSV Writerモジュールを設定するには、次のオプションを使用します:

オプション 説明
ファイルパス バケット名を含む、区切り文字付きテキストファイルのパスを指定します。
S3資格情報 プロフィールの「資格情報管理」セクションにある既存の認証情報を使用するか、アクセスキー、シークレットキー、AWSセッショントークンの詳細を入力して新しい認証情報のセットを作成します。
AWSリージョン S3バケットが配置されるリージョンを入力します。デフォルト値はus-east-1です。
ヘッダーを含める ヘッダー行を含めるかどうかを選択します。
既存のファイルを上書きする 既存のファイルを上書きするかどうかを選択します。
すべての文字列を二重引用符で囲む 文字列に二重引用符を追加します。
エンコーディング データのエンコーディングのタイプを指定します。デフォルトはUTF-8です。
区切り文字 フィールドの区切り文字を指定します。デフォルトはコンマです。

更新しました February 22, 2022
Back to top