プラットフォーム(V9.0)¶
次の表は、新機能の一覧です。
プラットフォームの機能強化¶
-
DataRobotのリリースバージョン9.0では、デプロイがKubernetesのみ対応となりました。 バージョン9.0では、OpenShift 4.10およびAWS EKS(K8s v1.23)をサポートしています。古いインストールオプション(Docker化、RPM、Hadoop)はサポートされなくなりました。 サポートされているバージョンのKubernetesを使用していない場合、Docker化、RPM、またはHadoopのインストールオプションで8.xバージョンのDataRobotを使用する必要があります。
-
MinioはDataRobotのインストール時にパッケージ化されません。 DataRobotで使用するS3 API互換のオブジェクトストアを用意および管理する必要があります。
-
DataRobotは、コンテナレジストリをパッケージ化しなくなりました。 DataRobotコンテナ用のdockerレジストリを用意する必要があります。
プレビュー:DataRobot Notebooks¶
DataRobotアプリケーションに、データサイエンス分析やモデリングのためのノートブックを作成・実行するためのブラウザー内エディターが追加されました。 Notebooksでは、計算結果をテキスト、画像、グラフ、プロット、表など、さまざまな形式で表示することができます。 オープンソースのプラグインを使用することで、出力表示をカスタマイズできます。 セルには、コーディングワークフローの注釈や説明のためのマークダウンリッチテキストを含めることもできます。 DataRobotでは、ノートブックを作成・編集すると、変更履歴が保存されるため、いつでも戻ることができます。
DataRobot Notebooksには、ノートブックの作成、アップロード、管理をホストするダッシュボードが用意されています。 個々のノートブックには、よく使われる機械学習ライブラリを備えた、コンテナ化された環境が組み込まれているため、数回のクリックで簡単に設定できます。 ノートブック環境はDataRobotのAPIとシームレスに統合され、セル関数のキーボードショートカット、インラインドキュメント、シークレット管理と自動認証のために保存された環境変数を利用できる、堅牢なコーディングエクスペリエンスを提供します。
プレビュー機能のドキュメントをご覧ください。
APIの機能強化¶
以下は、APIの新機能と機能強化の概要です。 各クライアントの詳細については、APIドキュメントをご覧ください。
ヒント
DataRobotでは、PythonとRのために最新のAPIクライアントにアップデートすることを強くお勧めします。
docs.datarobot.comからDataRobot REST APIドキュメントにアクセス¶
REST APIのドキュメントが、公開ドキュメントハブから直接ご覧いただけるようになりました。 これまで、REST APIのドキュメントは、アプリケーションからしかアクセスできませんでした。 現在は、公開ドキュメントサイトのAPIリファレンスセクションで、RESTのエンドポイントやパラメーターに関する情報にアクセスできます。
Pythonクライアントv3.0¶
DataRobotは、Pythonクライアントのバージョン3.0をリリースし、一般提供を開始しました。 このバージョンでは、クライアントの一般的なメソッドと使用方法に大幅な変更が加えられています。 主な変更点は以下の通りですが、バージョン3.0で導入された変更点の完全なリストはchangelogをご覧ください。
Pythonクライアントv3.0の新機能¶
バージョン3.0の新機能の概要は以下のとおりです。
- バージョン3.0のPythonクライアントは、Python 3.6以前のバージョンには対応していません。 バージョン3.0では、現在Python 3.7以降をサポートしています。
project.start_autopilot
メソッドのデフォルトのオートパイロットモードがAUTOPILOT_MODE.QUICK
に変更されました。- ファイル、ファイルパス、またはDataFrameをデプロイに渡すと、新しいメソッド
Deployment.predict_batch
を使って簡単にバッチ予測を行い、結果をDataFrameとして返すことができます。 - 新しいメソッドを使用して、プロジェクト、モデル、デプロイ、またはデータセットの正規URIを取得できます。
Project.get_uri
Model.get_uri
Deployment.get_uri
Dataset.get_uri
DataRobotプロジェクト用の新しいメソッド¶
datarobot.models.Project
で利用可能な新しいメソッドをご確認ください。
Project.get_options
では、保存されたモデリングオプションを取得できます。Project.set_options
は、モデリングに使用するAdvancedOptions
の値を保存します。Project.analyze_and_model
は、DataRobotにアップロードされたデータを使用して、オートパイロットまたはデータ解析を開始します。Project.get_dataset
は、プロジェクトの作成に使用されたデータセットを取得します。Project.set_partitioning_method
は、入力された引数に基づいて、通常のプロジェクトに適したPartitionクラスを作成します。Project.set_datetime_partitioning
は、時系列プロジェクトに適したPartitionクラスを作成します。Project.get_top_model
は、選択した指標について最もスコアの高いモデルを返します。
Pythonクライアントv3.1¶
DataRobotのPythonクライアントのバージョン3.1では、以下のAPIの機能が強化されました。
-
ファイルやデータセットに時系列データ準備を適用し、デプロイでバッチ予測を行う新しいメソッド
BatchPredictionJob.apply_time_series_data_prep_and_score
とBatchPredictionJob.apply_time_series_data_prep_and_score_to_file
を追加しました。 -
ファイルまたはカタログデータセットに時系列データ準備を適用し、予測データセットをプロジェクトにアップロードする新しいメソッド
DataEngineQueryGenerator.prepare_prediction_dataset
とDataEngineQueryGenerator.prepare_prediction_dataset_from_catalog
を追加しました。 -
メソッド
Project.create_from_dataset
に新しくmax_wait
パラメーターを追加しました。 データセットからプロジェクトを作成する際、タイムアウトを避けるために、デフォルトより大きな値を指定することができます。 -
既存のクラスタリングプロジェクトからセグメントモデリングプロジェクトを作成するための新しいメソッドとモデル
Project.create_segmented_project_from_clustering_model
を追加しました。 これまでセグメントモデリングを目的としてModelPackageを使用していた場合は、この関数に切り替えてください。 -
既存のクラスタリングプロジェクトからセグメントモデリングプロジェクトを作成するための新しいメソッドとモデル
Project.create_segmented_project_from_clustering_model
を追加しました。 -
RECOMMENDED_MODEL_TYPE
列挙型にPREPARED_FOR_DEPLOYMENT
を追加しました。 -
ImageAugmentationListクラスに2つの新しいメソッド
ImageAugmentationList.list
とImageAugmentationList.update
を追加しました。 -
S3、GCP、Azureでのバッチ予測の入出力設定に
format
キーを追加しました。 -
メソッド
PredictionExplanations.is_multiclass
に、多クラスターゲットの有効性をチェックするためのAPIコールを追加しました。それにより、処理時間がわずかに長くなります。 -
AdvancedOptions
のパラメーターblend_best_models
のデフォルトはFalseになりました。 -
AdvancedOptions <datarobot.helpers.AdvancedOptions>
のパラメーターconsider_blenders_in_recommendation
のデフォルトはFalseになりました。 -
DatetimePartitioning
にパラメーターunsupervised_mode
を追加しました。
プレビュー:Rクライアント v2.29¶
DataRobotは、Rクライアントのバージョン2.29をプレビュー版としてリリースしました。 それにより、RクライアントのバージョンはパブリックAPIのバージョン(2.29)と等しくなりました。 その結果、クライアントの一般的なメソッドと使用方法に大幅な変更が加えられています。 これらの変更は、(datarobot
ライブラリに加えて)新しいライブラリであるdatarobot.apicore
にカプセル化され、パブリックAPIにアクセスするための自動生成関数が提供されます。 datarobot
パッケージは、apicore
パッケージをより使いやすくするために、多数のAPIラッパー関数を提供しています。
インストール方法、詳細なメソッドの概要、リファレンスドキュメントなど、新しいRクライアントについて詳しくは、v2.29のドキュメントを参照してください。
新しいR関数¶
- 生成されたAPIラッパー関数は、OpenAPI仕様のタグに基づいてカテゴリー分けされていますが、関数自体はv2.27でDataRobotパブリックAPI全体に対して再設計されました。
- APIラッパー関数では、パッケージの他の部分と整合性を取るために、キャメルケースの引数名を使用しています。
- ほとんどの関数名は、OpenAPI仕様に基づく
VerbObject
パターンに従っています。 - 一部の関数名は、同じ接続先エンドポイントを呼び出した場合、Rクライアントのv2.18に存在した「レガシー」関数と同じです。 たとえば、ラッパー関数名は
RetrieveProjectsModels
ではなくGetModel
です。これは、Rクライアントでエンドポイント/projects/{mId}/models/{mId}
に対してRetrieveProjectsModelsが実装されたためです。 - 同様に、これらの関数は、対応する 「レガシー」 関数と同じ引数を使用して、DataRobotがこれらの関数を呼び出す既存のコードを壊さないようにします。
- Rクライアント(
datarobot
とdatarobot.apicore
の両パッケージ)は、DataRobotプラットフォームのPython 3への移行によって使用非推奨または無効になった特定のリソース(プロジェクト、モデル、デプロイなど)にアクセスしようとすると、警告を出力します。 drconfig.yaml
を対話的に修正できるヘルパー関数EditConfig
を追加しました。catalogId
を使用してデータセットをCSVファイルとして取得するDownloadDatasetAsCsv
関数を追加しました。- プロジェクトで特徴量探索の関係性を取得する
GetFeatureDiscoveryRelationships
関数を追加しました。 - Rクライアント(
datarobot
とdatarobot.apicore
の両パッケージ)は、DataRobotプラットフォームのPython 3への移行によって使用非推奨または無効になった特定のリソース(プロジェクト、モデル、デプロイなど)にアクセスしようとすると、警告を出力します。
Rの機能強化¶
RequestFeatureImpact
関数でrowCount
引数を指定できるようになりました。これにより、特徴量のインパクトの計算に使用されるサンプルサイズが変更されます。- 内部ヘルパー関数
ValidateModel
はValidateAndReturnModel
に名称変更され、apicore
パッケージのモデルクラスで使用できるようになりました。 - 関数
SetTarget
からquickrun
引数が削除されました。 代わりにmode = AutopilotMode.Quick
を設定してください。 - Transferable Modelsファミリーの関数(
ListTransferableModels
、GetTransferableModel
、RequestTransferableModel
、DownloadTransferableModel
、UploadTransferableModel
、UpdateTransferableModel
、DeleteTransferableModel
)が削除されました。 (長い間使用非推奨であった)接続先エンドポイントは、スタンドアロンスコアリングエンジン(SSE)の削除に伴い、パブリックAPIから削除されました。 - パブリックAPIのv2.27〜2.29に存在しない部分を表すファイル (コード、テスト、ドキュメント) を削除しました。
バックテストごとに特徴量のインパクトを計算¶
特徴量のインパクトは、特にモデルのコンプライアンスドキュメントにおいて、モデルの概要をわかりやすく示します。 さまざまなバックテストとホールドアウトパーティションでトレーニングされた時間依存モデルでは、バックテストごとに異なる特徴量のインパクトの計算を行うことができます。 一般提供機能になりました。DataRobotのREST APIを使用して、バックテストごとに特徴量のインパクトを計算できます。これにより、特徴量のインパクトのスコアをバックテスト間で比較することによって、時間経過に伴うモデルの安定性を検査できます。
サポート終了のお知らせ¶
サポートが終了したAPI¶
Rで使用非推奨になった機能¶
バージョン2.29での大きな変更点:
- 関数SetTargetから
quickrun
引数が削除されました。 代わりにmode = AutopilotMode.Quick
を設定してください。 -
Transferable Modelsの関数が削除されました。 接続先エンドポイントも、スタンドアロンスコアリングエンジン(SSE)の削除に伴い、パブリックAPIから削除されました。 削除された関数は以下の通りです。
ListTransferableModels
GetTransferableModel
RequestTransferableModel
DownloadTransferableModel
UploadTransferableModel
UpdateTransferableModel
DeleteTransferableModel
バージョン2.29で使用非推奨となったAPI:
- コンプライアンスドキュメント作成のAPIは使用非推奨です。 代わりにドキュメントの自動作成のAPIを使用してください。
サポートが終了したPython¶
バージョン3.0で使用非推奨となったAPIをご確認ください。
Project.set_target
は削除されました。 代わりにProject.analyze_and_model
を使用してください。PredictJob.create
は削除されました。 代わりにModel.request_predictions
を使用してください。Model.get_leaderboard_ui_permalink
は削除されました。 代わりにModel.get_uri
を使用してください。Project.open_leaderboard_browser
は削除されました。 代わりにProject.open_in_browser
を使用してください。ComplianceDocumentation
は削除されました。 代わりにAutomatedDocument
を使用してください。
バージョン3.1で使用非推奨となったのは次のとおりです。
- メソッド
Project.create_from_hdfs
が使用非推奨になりました。 - メソッド
DatetimePartitioning.generate
が使用非推奨になりました。 - DataRobotが自動的に処理するため、
ImageAugmentationList.create
のパラメーターin_use
が使用非推奨になりました。 Deployment
のプロパティDeployment.capabilities
は使用非推奨になりました。ImageAugmentationSample.compute
はv3.1で削除されました。メソッドImageAugmentationList.compute_samples
で同じ情報を得ることができます。sample_id
パラメーターはImageAugmentationSample.list
から削除されました。 代わりにauglist_id
を使用してください。
Hadoopのサポートを終了¶
バージョン9.0から、DataRobotはKubernetesにしかインストールできません。 Docker化、RPM、Hadoopでのインストールはできません。 また、モデリングや予測のためにHDFSから直接データを取り込む機能は、使用非推奨になりました。