マネージドAIプラットフォームリリース¶
このページでは、新たにリリースされ、DataRobotのSaaS型シングル/マルチテナントAIプラットフォームで利用できる機能についてのお知らせと、追加情報へのリンクを掲載しています。
今月のデプロイ¶
2023年2月22日
今回のデプロイにより、DataRobotのマネージドAIプラットフォームには、以下の一般提供およびパブリックプレビューの新機能が提供されました。 リリースセンターからは、次のものにもアクセスできます。
2月リリース¶
The following table lists each new feature. See the deployment history for past feature announcements and also the deprecation notices, below.
目的別にグループ化された機能
一般提供機能¶
Quick Autopilot improvements now available for time series¶
With this month’s release, Quick Autopilot has been streamlined for time series projects, speeding experimentation. In the new version of Quick, to maximize runtime efficiency, DataRobot no longer automatically generates and fits the DR Reduced Features list, as fitting requires retraining models. Models are still trained at the maximum sample size for each backtest, defined by the project’s date/time partitioning. The specific number of models run varying by project and target type. See the documentation on the model recommendation process for alternate methods to build a reduced feature list.
Retraining Combined Models now faster¶
Now generally available, time series segmented models now support retraining on the same feature list and blueprint as the original model without the need to rerun Autopilot or feature reduction. Previously, rerunning Autopilot was the only way to retrain this model type. This new support creates parity in retraining between retraining a non-segmented time series model and a segmented model. Because the improvement ensures that retraining leverages the feature reduction computations from the original, only newly introduced features need to go through that process, saving time and adding flexibility. Note that retraining retrains the champion of a segment, it does not rerun the project and select a new champion.
Python and Java Scoring Code snippets¶
Now generally available, DataRobot allows you to use Scoring Code via Python and Java. Although the underlying Scoringe Code is based off Java, DataRobot now provides the DataRobot Prediction Library to make predictions using various prediction methods supported by DataRobot via a Python API. The library provides a common interface for making predictions, making it easy to swap out any underlying implementation. Access Scoring Code for Python and Java from a model in the Leaderboard or from a deployed model that supports Scoring Code.
Export deployment data¶
一般提供機能になりました。デプロイの[データエクスポート]タブでは、保存済みのトレーニングデータ、予測データ、実測値データをエクスポートして、カスタム指標タブまたはDataRobot外部でカスタムビジネスまたはパフォーマンス指標を計算および監視することができます。 You can export the available deployment data for a specified model and time range. To export deployment data, make sure your deployment stores prediction data, generate data for the required time range, and then view or download that data.
備考
The initial release of the deployment data export feature enforces some row count limitations. For details, review the considerations in the feature documentation.
詳しくはデータエクスポートタブのドキュメントをご覧ください。
Create custom metrics¶
Now generally available, on a deployment's Custom Metrics tab, you can use the data you collect from the Data Export tab (or data calculated through other custom metrics) to compute and monitor up to 25 custom business or performance metrics. After you add a metric and upload data, a configurable dashboard visualizes a metric’s change over time and allows you to monitor and export that information. This feature enables you to implement your organization's specialized metrics to expand on the insights provided by DataRobot's built-in Service Health, Data Drift, and Accuracy metrics.
備考
カスタム指標機能の最初のリリースでは、行数とファイルサイズに制限が適用されています。 For details, review the considerations in the feature documentation.
詳しくはカスタム指標タブのドキュメントをご覧ください。
データドリフトタブでのドリルダウン¶
現在、データドリフトタブで一般提供されている新しいドリルダウン可視化機能では、デプロイされたモデルのトレーニングデータセットと、本番環境での予測生成に使用されるデータセットの間の、時間経過に伴う分布の差異が追跡されます。 トレーニングデータセットで確立されたベースラインからのドリフトは、PSI(Population Stability Index)を用いて測定されます。 モデルが新しいデータで予測を続けると、追跡対象の特徴量ごとにドリフト状況の経時変化がヒートマップとして視覚化されます。 このヒートマップは、データドリフトを特定し、デプロイ内の特徴量間でドリフトを比較して、相関性のあるドリフトの傾向を確認するのに役立ちます。
さらに、ヒートマップから1つ以上の特徴量を選択して、特徴量ドリフトの比較チャートを表示できます。このチャートでは、基準期間と比較期間の間で特徴量のデータ分布の変化を比較して、ドリフトを視覚化できます。 この情報は、データ品質の問題、特徴量構成の変化、ターゲット特徴量のコンテキストの変化など、デプロイされたモデルでのデータドリフトの原因を特定するのに役立ちます。
詳細については、データドリフトタブでのドリルダウンのドキュメントを参照してください。
Monitor deployment data processing¶
Now generally available, the Usage tab reports on prediction data processing for the Data Drift and Accuracy tabs. Monitoring a deployed model’s data drift and accuracy is a critical task to ensure that model remains effective; however, it requires processing large amounts of prediction data and can be subject to delays or rate limiting. The information on the Usage tab can help your organization identify these data processing issues. The Prediction Tracking chart, a bar chart of the prediction processing status over the last 24 hours or 7 days, tracks the number of processed, rate-limited, and missing association ID prediction rows:
ページの右側には、予測値の処理(チャンピオン)と実測値の処理(実測値処理の遅延は、デプロイ内の全モデルが対象)の処理遅延が表示されます。
詳しくは使用状況タブのドキュメントをご覧ください。
Deployment creation workflow redesign¶
Now generally available, the redesigned deployment creation workflow provides a better organized and more intuitive interface. 新しいデプロイを作成する場所(リーダーボード、モデルレジストリ、デプロイインベントリ)やアーティファクトのタイプ(DataRobotモデル、カスタム推論モデル、リモートモード)に関係なく、この新しいワークフローに移動します。 The new design clearly outlines the capabilities of your current deployment based on the data provided, grouping the settings and capabilities logically and providing immediate confirmation when you enable a capability, or guidance when you’re missing required fields or settings. A new sidebar provides details about the model being used to make predictions for your deployment, in addition to information about the deployment review policy, deployment billing details (depending on your organization settings), and a link to the deployment information documentation.
詳しくはデプロイの設定のドキュメントをご覧ください。
Connect to Snowflake using external OAuth¶
一般提供機能になりました。Snowflakeユーザーは、OAuthシングルサインオン(SSO)によるユーザー認証に外部IDプロバイダー(IdP:OktaまたはAzure Active Directory)を使用して、DataRobotでSnowflakeデータ接続を設定できます。
詳しくはSnowflakeの外部OAuthのドキュメントをご覧ください。
AIアプリにカスタムロゴを追加¶
一般提供機能になりました。AIアプリにカスタムロゴを追加できます。これにより、自社のブランドロゴをAIアプリに入れてから、社外・社内で共有することができます。
新しいロゴをアップロードするには、編集したいアプリケーションを開き、構築をクリックします。 設定 > 構成設定で、参照をクリックして新しい画像を選択するか、新しいロゴフィールドに画像をドラッグアンドドロップします。
詳細については、AIアプリのドキュメントを参照してください。
AIアプリでの多クラスのサポート¶
AIアプリは、多クラス分類のデプロイを3つのテンプレートタイプ(予測実行、最適化、What-If)すべてでサポートするようになりました。 This gives users the ability to create applications that solve a broader range of business problems.
パブリックプレビュー¶
Sliced insights show a subpopulation of model data¶
Now available as public preview, slices allow you to define filters for categorical, numeric, or both types of features. Viewing and comparing insights based on segments of a project’s data helps to understand how models perform on different subpopulations. You can also compare a slice against the “global” slice--all training data (depending on the insight). Configuring a slice allows you to choose a feature and set operators and values to narrow the data returned.
Sliced insights are available for Lift Chart, ROC Curve, Residual, and Feature Impact visualizations.
機能フラグ:スライスされたインサイトを有効にする
パブリックプレビュー機能のドキュメントをご覧ください。
Period Accuracy allows focus on specific periods in training data¶
Available as public preview for OTV and time series projects, the Period Accuracy insight lets you define periods within your dataset and then compare their metric scores against the metric score of the model as a whole. Periods are defined in a separate CSV file that identifies rows to group based on the project’s data/time feature.
Once uploaded, and with the insight calculated, DataRobot provides a table of period-based results and an “over time” histogram for each period.
Required feature flag: Period Accuracy Insight
パブリックプレビュー機能のドキュメントをご覧ください。
View Service Health and Accuracy history¶
Now available as a public preview feature, when analyzing a deployment's Service Health and Accuracy, you can view the History tab, providing critical information about the performance of current and previously deployed models. This tab improves the usability of service health and accuracy analysis, allowing you to view up to five models in one place and on the same scale, making it easier directly compare model performance.
On a deployment's Service Health > History tab, you can access visualizations representing the service health history of up to five of the most recently deployed models, including the currently deployed model. This history is available for each metric tracked in a model's service health, helping you identify bottlenecks and assess capacity, which is critical to proper provisioning.
On a deployment's Accuracy > History tab, you can access visualizations representing the accuracy history of up to five of the most recently deployed models, including the currently deployed model, allowing you to compare their accuracy directly. These accuracy insights are rendered based on the problem type and its associated optimization metrics.
必要な機能フラグ:デプロイ履歴を有効にする
パブリックプレビュー機能のドキュメントをご覧ください。
Create monitoring job definitions¶
Now available as a public preview feature, monitoring job definitions enable DataRobot to monitor deployments running and storing feature data and predictions outside of DataRobot, integrating deployments more closely with external data sources. For example, you can create a monitoring job to connect to Snowflake, fetch raw data from the relevant Snowflake tables, and send the data to DataRobot for monitoring purposes.
This integration extends the functionality of the existing Prediction API routes for batchPredictionJobDefinitions
and batchPredictions
, adding the batch_job_type: monitoring
property. This new property allows you to create monitoring jobs. In addition to the Prediction API, you can create monitoring job definitions through the DataRobot UI. You can then view and manage monitoring job definitions as you would any other job definition.
Required feature flag: Monitoring Job Definitions
パブリックプレビュー機能のドキュメントをご覧ください。
Automate deployment and replacement of Scoring Code in Snowflake¶
現在、パブリックプレビュー機能として提供されており、DataRobotが管理するSnowflakeの予測環境を作成し、SnowflakeにDataRobotのスコアリングコードをデプロイすることができます。 With the Managed by DataRobot option enabled, the model deployed externally to Snowflake has access to MLOps management, including automatic Scoring Code replacement:
Once you've created a Snowflake prediction environment, you can deploy a Scoring Code-enabled model to that environment from the Model Registry:
機能フラグ:Snowflakeでのスコアリングコードの自動デプロイと置換を有効にする
パブリックプレビュー機能のドキュメントをご覧ください。
Define runtime parameters for custom models¶
Now available as a public preview feature, you can add runtime parameters to a custom model through the model metadata, making your custom model code easier to reuse. To define runtime parameters, you can add the following runtimeParameterDefinitions
in model-metadata.yaml
:
キー | 値 |
---|---|
fieldName |
The name of the runtime parameter. |
type |
The data type the runtime parameter contains:string or credentials . |
defaultValue |
(Optional) The default string value for the runtime parameter (the credential type doesn't support default values). |
description |
(Optional) A descripton of the purpose or contents of the runtime parameter. |
When you add a model-metadata.yaml
file with runtimeParameterDefinitions
to DataRobot while creating a custom model, the Runtime Parameters section appears on the Assemble tab for that custom model:
機能フラグ:カスタムモデルでランタイムパラメーターの挿入を有効化
パブリックプレビュー機能のドキュメントをご覧ください。
サポート終了のお知らせ¶
DataRobot Prime model creation removed¶
With this deployment, the ability to create new DataRobot Prime models has been removed from the application. This does not affect existing Prime models or deployments. Rulefitモデルは、親モデルからの予測ではなく元のデータを予測ターゲットに使用する点のみがPrimeと異なり、Java/Pythonのソースコードのエクスポートをサポートしています。