2022年6月¶
2022年6月28日
今回のデプロイにより、DataRobotのマネージドAIプラットフォームには、以下の一般提供およびプレビューの新機能が提供されました。 過去の新機能のお知らせについては、デプロイ履歴をご覧ください。 こちらもご覧ください。
目的別にグループ化された機能
名前 | 一般提供 | プレビュー |
---|---|---|
データとインテグレーション | ||
特徴量探索で結合時の特徴量型の互換性を改善 | ✔ | |
特徴量探索ではデフォルトで特徴量派生ウィンドウ内の最新特徴量を探索 | ✔ | |
モデリング | ||
「選定前の」ブループリントを全ユーザーに提供 | ✔ | |
リーダーボードとリポジトリの新しいフィルターオプション | ✔ | |
XEMPでの多クラス予測の説明 | ✔ | |
セグメント化プロジェクトでの新しい指標のサポート | ✔ | |
ネイティブProphetおよび系列パフォーマンスブループリント | ✔ | |
AIアプリでの多クラスのサポート | ✔ | |
予測とMLOps | ||
予測APIにおける時系列入力の自動展開 | ✔ | |
MLOps管理エージェント | ✔ | |
MLOpsライブラリによる大規模監視 | ✔ | |
MLOpsのJavaライブラリとエージェントを一般公開 | ✔ | |
MLOps監視エージェントのイベントログ | ✔ | |
予測APIのcURLスクリプトコード | ✔ | |
時系列セグメントモデリングのデプロイ | ✔ |
一般提供¶
「選定前の」ブループリントを全ユーザーに提供¶
これまで、DataRobotのユーザーは、組織での設定に応じて、選定前または選定後のブループリントのどちらかを見ることができました。 この設定の違いは、モデルのブループリントタブに表示される前処理の詳細(データの前処理やパラメーター設定を図示したもの)に反映されました。 このリリースから、DataRobotで使われている特定のアルゴリズムをすべてのユーザーが確認できるようになりました。 (なお、すでに選定前のブループリントをお持ちの場合は、機能の変更はありません。)
選定前のブループリントでは、さらに次の機能を利用できます。
- Composable ML内から、より多くのオプションを利用できます。
- データ品質処理レポートにアクセスできます。
- より完全なモデルドキュメント(ブループリントのタスク内からDataRobotモデルドキュメントをクリック)を閲覧できます。
特徴量探索で結合時の特徴量型の互換性を改善¶
特徴量探索で、異なるタイプの列を使用してセカンダリーデータセットを結合できるようになりました。 以前は、結合を実行するには、列が同じタイプである必要がありました。
結合の互換性については、特徴量探索のドキュメントを参照してください。
特徴量探索ではデフォルトで特徴量派生ウィンドウ内の最新特徴量を探索¶
特徴量探索プロセスの一部として、DataRobotは、探索エンジニアリングを行う際に、新しい設定であるウィンドウ内の最新の値をデフォルトで使用するようになりました。 この新しい設定では、定義された特徴量探索ウィンドウ(FDW)の終点までのすべての履歴データを探索して最新の値を生成するのではなく、定義されたFDW内で最新の値を探索します。 デフォルトの設定は、特徴量探索の設定 > 特徴量エンジニアリングで変更できます。
詳細については、特徴量探索のドキュメントを参照してください。
リーダーボードとリポジトリの新しいフィルターオプション¶
このリリースから、リーダーボードやリポジトリで、選択したフィルターに一致するモデル/ブループリントだけを表示できるようになりました。 リーダーボードのフィルターでは、サンプルサイズ(または時系列プロジェクトの場合はトレーニング期間)、モデルファミリー、モデル特性、特徴量セットなどに分類されたオプションを設定できます。 リポジトリのフィルターには、ブループリントの特性、ファミリー、およびタイプが含まれます。 以前は、フィルターのためのより限定的な方法が別々の場所にありました。しかし、新しく強化されたフィルターオプションは、単一のモーダルに集約されています(1つはリーダーボード用、もう1つはリポジトリ用)。
詳細については、リーダーボードのリファレンスを参照してください。
XEMPでの多クラス予測の説明¶
一般提供機能になりました。DataRobotは、XEMPベースの多クラス分類プロジェクトにおいて、リーダーボードとデプロイの両方から各クラスの説明を計算します。 多クラスでは、計算するクラスの数を設定できます。また、予測結果や実際の結果からモードを選択したり(トレーニングデータを使用する場合)、特定のクラスのセットのみを表示するように指定したりすることもできます。
詳細については、多クラスでのXEMP予測の説明のセクションを参照してください。
セグメント化プロジェクトでの新しい指標のサポート¶
統合されたモデルは、時系列のセグメントモデリングプロジェクトにおいてすべてのセグメントの収集ポイントとして機能する主要な統括プロジェクトです。 このバージョンから、RMSEベースの指標がサポートされるようになりました。セグメントプロジェクトでは、これまでのMAD、MAE、MAPE、MASE、SMAPEのサポートに加えて、RMSE、RMSLE、Theil’s U(重み付けあり/なし)もサポートされます。
ネイティブProphetおよび系列パフォーマンスブループリント¶
単一および複数系列の時系列プロジェクトで、ネイティブProphet、ETS、TBATSモデルのサポートが一般提供されるようになりました。 モデルの詳細な説明は、モデルのブループリントにアクセスすることで、モデルごとに確認できます。
予測APIにおける時系列入力の自動展開¶
時系列モデルにおいて、予測ポイントを用いてAPI経由で予測を行う場合、予測データで予測ウィンドウをスキップできるようになりました。 DataRobotは、自動展開により予測ポイントを自動生成します。 自動展開は、予測範囲ではなく、特定の予測ポイントに対して予測が行われる場合に自動的に適用されます。 また、時系列プロジェクトに正規の時間ステップがあり、ナウキャストを使用していない場合にも適用されます。
MLOps管理エージェント¶
一般提供機能になりました。MLOps管理エージェントは、あらゆるタイプの環境やインフラストラクチャにおいてモデルデプロイを自動化するための標準的なメカニズムを提供します。 管理エージェントは、DataRobotでトレーニングされたモデルや、外部インフラストラクチャでオープンソースツールを使ってトレーニングされたモデルをサポートします。 DataRobotアプリケーションからアクセスされるエージェントには、カスタム設定をサポートするサンプルプラグインが付属しています。 管理エージェントを使用してモデルのデプロイと監視を自動化し、機械学習パイプラインの正常性と信頼性を確保します。 このリリースでは、デプロイステータスのレポート、デプロイの再起動、管理エージェントのデプロイを強制的に削除するオプションなど、管理エージェントの操作性が向上しています。
エージェントのインストール、設定、および操作の詳細については、MLOps管理エージェントのドキュメントを参照してください。
MLOpsライブラリによる大規模監視¶
大規模な監視をサポートするために、MLOpsライブラリは、クライアント側で元のデータから統計情報を計算する方法を提供します。 そして、DataRobot MLOpsサービスに元の特徴量と予測値を報告する代わりに、クライアントは特徴量と予測データを含まない匿名化された統計情報を報告することができます。 クライアント側で計算された予測データの統計情報を報告することは、元データの報告と比較して、特に大規模な場合(数十億行の特徴量と予測値)に最適な方法です。 また、クライアント側の集計では、特徴量値の集計を送信するだけなので、実際の特徴量値を公開したくない環境に適しています。
大規模監視機能は、Java Software Development Kit(SDK)およびMLOps Spark Utils Libraryで利用可能です。
reportPredictionsData()
の呼び出しを reportAggregatePredictionsData()
の呼び出しに置き換えます。
reportPredictions()
の呼び出しを predictionStatisticsParameters.report()
の呼び出しに置き換えます。
このユースケースの例は、エージェント.tar
ファイルの examples/java/PredictionStatsSparkUtilsExample
にあります。
備考
チャレンジャーモデルの使用をサポートするには、元の特徴量を送信する必要があります。 大規模なデータセットの場合、元の特徴量と予測データの少量のサンプルをレポートすることで、チャレンジャーやレポートに対応できます。その後、残りのデータを集約形式で送信することが可能です。
このユースケースについては、監視エージェントのユースケースに関するドキュメントを参照してください。
MLOpsのJavaライブラリとエージェントを一般公開¶
MLOpsのJavaライブラリとエージェントを、公開されているMavenリポジトリから、groupId
にcom.datarobot
、artifactId
にdatarobot-mlops
(ライブラリ)およびmlops-agent
(エージェント)を指定してダウンロードできるようになりました。 また、MavenリポジトリでDataRobot MLOps LibraryとDataRobot MLOps Agentのアーティファクトにアクセスすると、すべてのバージョンを確認でき、JARファイルをダウンロードしてインストールすることが可能です。
MLOps監視エージェントのイベントログ¶
一般提供機能になりました。デプロイのサービスの正常性タブの最近のアクティビティで、管理イベント(デプロイアクションなど)と監視イベント(スプーラーチャネルおよびレート制限イベントなど)を表示できます。 監視イベントは、MLOpsエージェントの問題を迅速に診断するのに役立ちます。 たとえば、スプーラーチャネルエラーイベントは、スプーラー設定の問題を診断して修正するのに役立ち、レート制限実施イベントは、APIリクエストのレート制限を超えたためにサービス正常性の統計、またはデータドリフトと精度の値が更新されていないかどうかを特定するのに役立ちます。
監視イベントを表示するには、エージェント設定ファイル(conf\mlops.agent.conf.yaml
)でpredictionEnvironmentID
を指定する必要があります。 MLOpsエージェントのインストールと設定がまだの場合は、インストールと設定のガイドを参照してください。
監視エージェントのイベントログの有効化と読み出しについて詳しくは、監視エージェントのイベントログのドキュメントを参照してください。
予測APIのcURLスクリプトコード¶
デプロイの予測 > 予測APIタブにある[予測APIスクリプトコード]セクションに、リアルタイム予測用のcURLスクリプトコードスニペットが追加されました。 cURLは、さまざまなネットワークプロトコルを使用してデータを転送するコマンドラインツールであり、ほとんどのLinuxディストリビューションとmacOSにおいてデフォルトで使用可能です。
予測APIのcURLスクリプトコードの詳細については、リアルタイム予測スニペットのドキュメントを参照してください。
プレビュー¶
AIアプリでの多クラスのサポート¶
AIアプリは、二値分類と連続値問題に加えて、多クラス分類のデプロイを3つのテンプレート(予測実行、最適化、What-If)すべてでサポートするようになりました。 これにより、複数の業界にまたがる広範なビジネス課題に対してAIアプリを活用できるようになり、そのメリットと価値が拡大しました。
必要な機能フラグ:アプリケーションビルダーの多クラスサポートを有効にする
時系列セグメントモデリングのデプロイ¶
プレビュー版の機能です。セグメントモデリングの価値を最大限に活用するために、他の時系列モデルをデプロイする場合と同様に、統合されたモデルをデプロイできます。 含まれているプロジェクトごとにチャンピオンモデルを選択した後、統合されたモデルをデプロイして、予測を本番環境に反映させることができます。 デプロイを作成すると、精度監視、予測間隔、およびチャレンジャーモデルにDataRobot MLOpsを使用できます。
備考
時系列セグメントモデリングのデプロイでは、データドリフトの監視、予測の説明、再トレーニングには対応していません。
時系列の統合モデルのデプロイ¶
セグメントモデリングのワークフローが完了したら、生成された統合モデルをデプロイして、その予測を本番環境に反映させることができます。 オートパイロットが終了すると、モデル > リーダーボードタブにモデルが1つ表示されます。 このモデルが完成した統合モデルです。 デプロイするには、統合されたモデル、予測 > デプロイ、モデルをデプロイの順にクリックします。
デプロイされた統合モデルの修正とクローン作成¶
統合モデルをデプロイした場合、セグメントのチャンピオンを変更するには、デプロイされた統合モデルのクローンを作成し、クローンが作成されたモデルを修正する必要があります。 この処理は自動的に行われ、デプロイされた統合モデル内でセグメントのチャンピオンを変更しようとすると発生します。 クローンが作成され、修正可能なモデルが、アクティブな統合モデルになります。 このプロセスにより、デプロイされたモデルの安定性を確保しながら、同じセグメントプロジェクト内で変更をテストすることが可能になります。
備考
プロジェクトでアクティブな統合モデル(バッジ付き)になれる統合モデルは1つだけです。
統合されたモデルがデプロイされると、予測APIは有効というラベルが設定されます。 このモデルを修正するには、アクティブでデプロイ済みの統合モデルをクリックし、セグメントタブで修正したいセグメントをクリックします。
次に、セグメントチャンピオンを再割り当てし、表示されるダイアログボックスではい、新しい統合モデルを作成しますをクリックします。
セグメントのリーダーボードで、アクティブな統合モデルにアクセスして修正できるようになりました。
必要な機能フラグ:時系列でセグメント化されたデプロイのサポートを有効化
セグメントモデリングのドキュメントをご覧ください。
APIの機能強化¶
以下は、APIの新機能と機能強化の概要です。 各クライアントの詳細については、APIドキュメントをご覧ください。
ヒント
DataRobotでは、PythonとRのために最新のAPIクライアントにアップデートすることを強くお勧めします。
docs.datarobot.comからDataRobot REST APIドキュメントにアクセス¶
REST APIのドキュメントが、公開ドキュメントハブから直接ご覧いただけるようになりました。 これまで、REST APIのドキュメントは、アプリケーションからしかアクセスできませんでした。 現在は、公開ドキュメントサイトのAPIリファレンスセクションで、RESTのエンドポイントやパラメーターに関する情報にアクセスできます。
プレビュー:資格情報ストアにデフォルトの資格情報を設定¶
資格情報ストア内の特定のリソースについて、関連付けられた資格情報をデフォルトセットにすることができます。 REST APIを直接呼び出す場合、資格情報の関連付けのために新たに実装されたAPIルートを使用して、デフォルトの資格情報を要求できます。
PUT /api/v2/credentials/(credentialId)/associations/(associationId)/
GET /api/v2/credentials/associations/(associationId)/
サポート終了のお知らせ¶
Auto-Tuned Word N-gram Text Modelerのブループリントをリーダーボードから削除¶
2022年7月6日より、二値分類、連続値、多クラス/マルチモーダルの各プロジェクトでは、Auto-Tuned Word N-gram Text Modelerのブループリントがオートパイロットの一部として実行されなくなりました。 ただし、このモデラーブループリントは、引き続きリポジトリから入手可能です。 現在、Light GBM (LGBM) モデルは、これらの自動チューニングされたテキストモデラーをテキスト列ごとに実行し、それぞれについて、新しいブループリントがリーダーボードに追加されます。 しかし、これらのAuto-Tuned Word N-gram Text Modelerは元のLGBMモデルと相関しません(つまり、これらを修正しても元のLGBMモデルには影響がありません)。 無効にすると、オートパイロットは、テキスト列ごとに1つではなく、すべてのAuto-Tuned Word N-gram Text Modelerタスクに対して1つの大きなブループリントを作成するようになりました。 なお、この変更に下位互換性の問題はなく、新しいプロジェクトにのみ適用されます。
特徴量ごとの予実によるインサイトを7月に無効化¶
2022年7月より、評価 > 特徴量ごとの予実によるインサイトが無効となりました。 既存のプロジェクトではリーダーボードからこのオプションが表示されず、新規プロジェクトではチャートが作成されません。 組織の管理者は、ツールが完全に削除されるまで、ユーザーに対してこの機能を再び有効にすることができます。 特徴量ごとの予実の代わりに、特徴量ごとの作用によるインサイトを使用すると、同じ出力が得られます。
USER/オープンソースモデルが使用非推奨になり、その後無効化¶
このリリースでは、USER/オープンソース(「ユーザー」)タスクを含むすべてのモデルが使用非推奨です。 既存モデルの非推奨の正確なプロセスは、今後数か月の間に展開され、その影響は後続のリリースでお知らせする予定です。
影響を受けるモデルの特定
モデルが使用非推奨かどうかを判断するには、ブループリントを開いてタスク名を確認します。
さらに、リーダーボードのモデルの説明にタスクが一覧表示されます。
Composable MLではUSERモデルを使用する代わりにカスタムモデルを作成できるため、今回このような変更を行っています。 また、現在サポートされているすべてのオープンソースモデルに対応したネイティブソリューションが用意されています。 既存のUSER/オープンソースモデルの廃止と置き換えによって、潜在的なセキュリティ上の懸念に対処します。
現時点では、過去6か月間に使用非推奨のモデルで(リーダーボードまたはデプロイを介して)予測を生成したユーザーに連絡し、移行計画を提供しています。 このようなモデルを予測に使用していると思われるのに、連絡がない場合は、DataRobotの担当者に連絡してください。
Excelアドインを2022年7月に削除¶
DataRobotのExcelアドインは、2022年7月に削除されました。 すでにダウンロードされているお客様は、引き続きこのアドインをご利用いただけますが、サポートや今後の開発は行いません。
記載されている製品名および会社名は、各社の商標または登録商標です。 製品名または会社名の使用は、それらとの提携やそれらによる推奨を意味するものではありません。