プラットフォーム(V9.0)¶
次の表は、新機能の一覧です。
プラットフォームの機能強化¶
-
DataRobotのリリースバージョン9.0では、デプロイがKubernetesのみ対応となりました。 バージョン9.0では、OpenShift 4.10およびAWS EKS(K8s v1.23)をサポートしています。古いインストールオプション(Docker化、RPM、Hadoop)はサポートされなくなりました。 サポートされているバージョンのKubernetesを使用していない場合、Docker化、RPM、またはHadoopのインストールオプションで8.xバージョンのDataRobotを使用する必要があります。
-
MinioはDataRobotのインストール時にパッケージ化されません。 DataRobotで使用するS3 API互換のオブジェクトストアを用意および管理する必要があります。
-
DataRobotは、コンテナレジストリをパッケージ化しなくなりました。 DataRobotコンテナ用のdockerレジストリを用意する必要があります。
プレビュー:DataRobot Notebooks¶
DataRobotアプリケーションに、データサイエンス分析やモデリングのためのノートブックを作成・実行するためのブラウザー内エディターが追加されました。 Notebooksでは、計算結果をテキスト、画像、グラフ、プロット、表など、さまざまな形式で表示することができます。 オープンソースのプラグインを使用することで、出力表示をカスタマイズできます。 セルには、コーディングワークフローの注釈や説明のためのマークダウンリッチテキストを含めることもできます。 DataRobotでは、ノートブックを作成・編集すると、変更履歴が保存されるため、いつでも戻ることができます。
DataRobot Notebooksには、ノートブックの作成、アップロード、管理をホストするダッシュボードが用意されています。 個々のノートブックには、よく使われる機械学習ライブラリを備えた、コンテナ化された環境が組み込まれているため、数回のクリックで簡単に設定できます。 ノートブック環境はDataRobotのAPIとシームレスに統合され、セル関数のキーボードショートカット、インラインドキュメント、シークレット管理と自動認証のために保存された環境変数を利用できる、堅牢なコーディングエクスペリエンスを提供します。
プレビュー機能のドキュメントをご覧ください。
APIの機能強化¶
以下は、APIの新機能と機能強化の概要です。 各クライアントの詳細については、APIドキュメントをご覧ください。
ヒント
DataRobotでは、PythonとRのために最新のAPIクライアントにアップデートすることを強くお勧めします。
docs.datarobot.comからDataRobot REST APIドキュメントにアクセス¶
REST APIのドキュメントが、公開ドキュメントハブから直接ご覧いただけるようになりました。 これまで、REST APIのドキュメントは、アプリケーションからしかアクセスできませんでした。 現在は、公開ドキュメントサイトのAPIリファレンスセクションで、RESTのエンドポイントやパラメーターに関する情報にアクセスできます。
Pythonクライアントv3.0¶
DataRobotは、Pythonクライアントのバージョン3.0をリリースし、一般提供を開始しました。 このバージョンでは、クライアントの一般的なメソッドと使用方法に大幅な変更が加えられています。 主な変更点は以下の通りですが、バージョン3.0で導入された変更点の完全なリストはchangelogをご覧ください。
Pythonクライアントv3.0の新機能¶
バージョン3.0の新機能の概要は以下のとおりです。
- バージョン3.0のPythonクライアントは、Python 3.6以前のバージョンには対応していません。 バージョン3.0では、現在Python 3.7以降をサポートしています。
project.start_autopilotメソッドのデフォルトのオートパイロットモードがAUTOPILOT_MODE.QUICKに変更されました。- ファイル、ファイルパス、またはDataFrameをデプロイに渡すと、新しいメソッド
Deployment.predict_batchを使って簡単にバッチ予測を行い、結果をDataFrameとして返すことができます。 - 新しいメソッドを使用して、プロジェクト、モデル、デプロイ、またはデータセットの正規URIを取得できます。
Project.get_uriModel.get_uriDeployment.get_uriDataset.get_uri
DataRobotプロジェクト用の新しいメソッド¶
datarobot.models.Projectで利用可能な新しいメソッドをご確認ください。
Project.get_optionsでは、保存されたモデリングオプションを取得できます。Project.set_optionsは、モデリングに使用するAdvancedOptionsの値を保存します。Project.analyze_and_modelは、DataRobotにアップロードされたデータを使用して、オートパイロットまたはデータ解析を開始します。Project.get_datasetは、プロジェクトの作成に使用されたデータセットを取得します。Project.set_partitioning_methodは、入力された引数に基づいて、通常のプロジェクトに適したPartitionクラスを作成します。Project.set_datetime_partitioningは、時系列プロジェクトに適したPartitionクラスを作成します。Project.get_top_modelは、選択した指標について最もスコアの高いモデルを返します。
Pythonクライアントv3.1¶
DataRobotのPythonクライアントのバージョン3.1では、以下のAPIの機能が強化されました。
-
ファイルやデータセットに時系列データ準備を適用し、デプロイでバッチ予測を行う新しいメソッド
BatchPredictionJob.apply_time_series_data_prep_and_scoreとBatchPredictionJob.apply_time_series_data_prep_and_score_to_fileを追加しました。 -
ファイルまたはカタログデータセットに時系列データ準備を適用し、予測データセットをプロジェクトにアップロードする新しいメソッド
DataEngineQueryGenerator.prepare_prediction_datasetとDataEngineQueryGenerator.prepare_prediction_dataset_from_catalogを追加しました。 -
メソッド
Project.create_from_datasetに新しくmax_waitパラメーターを追加しました。 データセットからプロジェクトを作成する際、タイムアウトを避けるために、デフォルトより大きな値を指定することができます。 -
既存のクラスタリングプロジェクトからセグメントモデリングプロジェクトを作成するための新しいメソッドとモデル
Project.create_segmented_project_from_clustering_modelを追加しました。 これまでセグメントモデリングを目的としてModelPackageを使用していた場合は、この関数に切り替えてください。 -
既存のクラスタリングプロジェクトからセグメントモデリングプロジェクトを作成するための新しいメソッドとモデル
Project.create_segmented_project_from_clustering_modelを追加しました。 -
RECOMMENDED_MODEL_TYPE列挙型にPREPARED_FOR_DEPLOYMENTを追加しました。 -
ImageAugmentationListクラスに2つの新しいメソッド
ImageAugmentationList.listとImageAugmentationList.updateを追加しました。 -
S3、GCP、Azureでのバッチ予測の入出力設定に
formatキーを追加しました。 -
メソッド
PredictionExplanations.is_multiclassに、多クラスターゲットの有効性をチェックするためのAPIコールを追加しました。それにより、処理時間がわずかに長くなります。 -
AdvancedOptionsのパラメーターblend_best_modelsのデフォルトはFalseになりました。 -
AdvancedOptions <datarobot.helpers.AdvancedOptions>のパラメーターconsider_blenders_in_recommendationのデフォルトはFalseになりました。 -
DatetimePartitioningにパラメーターunsupervised_modeを追加しました。
プレビュー:Rクライアント v2.29¶
DataRobotは、Rクライアントのバージョン2.29をプレビュー版としてリリースしました。 それにより、RクライアントのバージョンはパブリックAPIのバージョン(2.29)と等しくなりました。 その結果、クライアントの一般的なメソッドと使用方法に大幅な変更が加えられています。 これらの変更は、(datarobotライブラリに加えて)新しいライブラリであるdatarobot.apicoreにカプセル化され、パブリックAPIにアクセスするための自動生成関数が提供されます。 datarobotパッケージは、apicoreパッケージをより使いやすくするために、多数のAPIラッパー関数を提供しています。
インストール方法、詳細なメソッドの概要、リファレンスドキュメントなど、新しいRクライアントについて詳しくは、v2.29のドキュメントを参照してください。
新しいR関数¶
- 生成されたAPIラッパー関数は、OpenAPI仕様のタグに基づいてカテゴリー分けされていますが、関数自体はv2.27でDataRobotパブリックAPI全体に対して再設計されました。
- APIラッパー関数では、パッケージの他の部分と整合性を取るために、キャメルケースの引数名を使用しています。
- ほとんどの関数名は、OpenAPI仕様に基づく
VerbObjectパターンに従っています。 - 一部の関数名は、同じ接続先エンドポイントを呼び出した場合、Rクライアントのv2.18に存在した「レガシー」関数と同じです。 たとえば、ラッパー関数名は
RetrieveProjectsModelsではなくGetModelです。これは、Rクライアントでエンドポイント/projects/{mId}/models/{mId}に対してRetrieveProjectsModelsが実装されたためです。 - 同様に、これらの関数は、対応する 「レガシー」 関数と同じ引数を使用して、DataRobotがこれらの関数を呼び出す既存のコードを壊さないようにします。
- Rクライアント(
datarobotとdatarobot.apicoreの両パッケージ)は、DataRobotプラットフォームのPython 3への移行によって使用非推奨または無効になった特定のリソース(プロジェクト、モデル、デプロイなど)にアクセスしようとすると、警告を出力します。 drconfig.yamlを対話的に修正できるヘルパー関数EditConfigを追加しました。catalogIdを使用してデータセットをCSVファイルとして取得するDownloadDatasetAsCsv関数を追加しました。- プロジェクトで特徴量探索の関係性を取得する
GetFeatureDiscoveryRelationships関数を追加しました。 - Rクライアント(
datarobotとdatarobot.apicoreの両パッケージ)は、DataRobotプラットフォームのPython 3への移行によって使用非推奨または無効になった特定のリソース(プロジェクト、モデル、デプロイなど)にアクセスしようとすると、警告を出力します。
Rの機能強化¶
RequestFeatureImpact関数でrowCount引数を指定できるようになりました。これにより、特徴量のインパクトの計算に使用されるサンプルサイズが変更されます。- 内部ヘルパー関数
ValidateModelはValidateAndReturnModelに名称変更され、apicoreパッケージのモデルクラスで使用できるようになりました。 - 関数
SetTargetからquickrun引数が削除されました。 代わりにmode = AutopilotMode.Quickを設定してください。 - Transferable Modelsファミリーの関数(
ListTransferableModels、GetTransferableModel、RequestTransferableModel、DownloadTransferableModel、UploadTransferableModel、UpdateTransferableModel、DeleteTransferableModel)が削除されました。 (長い間使用非推奨であった)接続先エンドポイントは、スタンドアロンスコアリングエンジン(SSE)の削除に伴い、パブリックAPIから削除されました。 - パブリックAPIのv2.27〜2.29に存在しない部分を表すファイル (コード、テスト、ドキュメント) を削除しました。
バックテストごとに特徴量のインパクトを計算¶
特徴量のインパクトは、特にモデルのコンプライアンスドキュメントにおいて、モデルの概要をわかりやすく示します。 さまざまなバックテストとホールドアウトパーティションでトレーニングされた時間依存モデルでは、バックテストごとに異なる特徴量のインパクトの計算を行うことができます。 一般提供機能になりました。DataRobotのREST APIを使用して、バックテストごとに特徴量のインパクトを計算できます。これにより、特徴量のインパクトのスコアをバックテスト間で比較することによって、時間経過に伴うモデルの安定性を検査できます。
サポート終了のお知らせ¶
サポートが終了したAPI¶
Rで使用非推奨になった機能¶
バージョン2.29での大きな変更点:
- 関数SetTargetから
quickrun引数が削除されました。 代わりにmode = AutopilotMode.Quickを設定してください。 -
Transferable Modelsの関数が削除されました。 接続先エンドポイントも、スタンドアロンスコアリングエンジン(SSE)の削除に伴い、パブリックAPIから削除されました。 削除された関数は以下の通りです。
ListTransferableModelsGetTransferableModelRequestTransferableModelDownloadTransferableModelUploadTransferableModelUpdateTransferableModelDeleteTransferableModel
バージョン2.29で使用非推奨となったAPI:
- コンプライアンスドキュメント作成のAPIは使用非推奨です。 代わりにドキュメントの自動作成のAPIを使用してください。
サポートが終了したPython¶
バージョン3.0で使用非推奨となったAPIをご確認ください。
Project.set_targetは削除されました。 代わりにProject.analyze_and_modelを使用してください。PredictJob.createは削除されました。 代わりにModel.request_predictionsを使用してください。Model.get_leaderboard_ui_permalinkは削除されました。 代わりにModel.get_uriを使用してください。Project.open_leaderboard_browserは削除されました。 代わりにProject.open_in_browserを使用してください。ComplianceDocumentationは削除されました。 代わりにAutomatedDocumentを使用してください。
バージョン3.1で使用非推奨となったのは次のとおりです。
- メソッド
Project.create_from_hdfsが使用非推奨になりました。 - メソッド
DatetimePartitioning.generateが使用非推奨になりました。 - DataRobotが自動的に処理するため、
ImageAugmentationList.createのパラメーターin_useが使用非推奨になりました。 DeploymentのプロパティDeployment.capabilitiesは使用非推奨になりました。ImageAugmentationSample.computeはv3.1で削除されました。メソッドImageAugmentationList.compute_samplesで同じ情報を得ることができます。sample_idパラメーターはImageAugmentationSample.listから削除されました。 代わりにauglist_idを使用してください。
Hadoopのサポートを終了¶
バージョン9.0から、DataRobotはKubernetesにしかインストールできません。 Docker化、RPM、Hadoopでのインストールはできません。 また、モデリングや予測のためにHDFSから直接データを取り込む機能は、使用非推奨になりました。
