2023年2月¶
2023年2月22日
このページでは、新たにリリースされ、DataRobotのSaaS型シングル/マルチテナントAIプラットフォームで利用できる機能についてのお知らせと、追加情報へのリンクを掲載しています。 2月のデプロイにより、DataRobotのAIプラットフォームには、以下の一般提供およびプレビューの新機能が提供されました。 リリースセンターからは、次のものにもアクセスできます。
2月リリース¶
次の表は、新機能の一覧です。 過去の新機能のお知らせについては、デプロイ履歴を参照してください。また、以下のサポート終了のお知らせもご覧ください。
目的別にグループ化された機能
名前 | 一般提供 | プレビュー |
---|---|---|
データ | ||
外部OAuthを使用してSnowflakeに接続 | ✔ | |
モデリング | ||
クイックオートパイロットの改善を時系列に適用 | ✔ | |
統合されたモデルの再トレーニングが高速化 | ✔ | |
AIアプリにカスタムロゴを追加 | ✔ | |
AIアプリでの多クラスのサポート | ✔ | |
スライスされたインサイトでモデルデータの部分母集団を表示 | ✔ | |
期間精度を使用して、トレーニングデータの特定の期間に焦点を当てる | ✔ | |
予測とMLOps | ||
PythonとJavaのスコアリングコードスニペット | ✔ | |
デプロイデータのエクスポート | ✔ | |
カスタム指標の作成 | ✔ | |
データドリフトタブでのドリルダウン | ✔ | |
デプロイデータ処理の監視 | ✔ | |
デプロイ作成ワークフローの再設計 | ✔ | |
サービスの正常性と精度の履歴を表示 | ✔ | |
監視ジョブ定義の作成 | ✔ | |
Snowflakeでスコアリングコードのデプロイと置換を自動化 | ✔ | |
カスタムモデルのランタイムパラメーターを定義 | ✔ |
一般提供¶
クイックオートパイロットの改善を時系列に適用¶
このリリースでは、クイックオートパイロットが時系列プロジェクト向けに効率化され、エクスペリメントがスピードアップしました。 新バージョンのクイックオートパイロットでは、実行時の効率を最大限に高めるために、特徴量を削減した特徴量セットの自動生成とフィッティングが行われなくなりました。フィッティングにはモデルの再トレーニングが必要であるためです。 モデルは、プロジェクトの日時パーティションで定義された、各バックテストの最大サンプルサイズで引き続きトレーニングされます。 モデルの具体的な実行回数は、プロジェクトやターゲットのタイプによって異なります。 特徴量を削減した特徴量セットを作成するための代替方法については、モデル推奨プロセスのドキュメントを参照してください。
統合されたモデルの再トレーニングが高速化¶
一般提供機能になりました。時系列セグメントモデルでは、オートパイロットや特徴量削減を再実行することなく、元のモデルと同じ特徴量セットとブループリントで再トレーニングを行えるようになりました。 これまでは、オートパイロットを再実行することが、このモデルタイプを再トレーニングする唯一の方法でした。 この新しいサポートにより、セグメント化されていない時系列モデルとセグメント化されたモデルの再トレーニングが同等になりました。 この改善により、再トレーニングでは、元のトレーニングでの特徴量削減処理を活用できるようになりました。そのプロセスを経る必要があるのは、新しく導入された特徴量だけになったので、時間の節約と柔軟性の向上を実現できます。 再トレーニングはセグメントのチャンピオンを再トレーニングするものであり、プロジェクトを再実行して新しいチャンピオンを選ぶものではないことに注意してください。
PythonとJavaのスコアリングコードスニペット¶
一般提供機能になりました。DataRobotでは、PythonとJavaによるスコアリングコードの使用が可能です。 基になるスコアリングコードはJavaをベースとしていますが、DataRobotがサポートするさまざまな予測手法を用いた予測をPython APIで行うためのDataRobot Prediction Libraryを提供することになりました。 ライブラリは予測を行うための共通のインターフェイスを提供するので、ベースとなる実装を簡単に交換できます。 リーダーボードのモデル、またはスコアリングコードに対応するデプロイモデルから、PythonおよびJavaのスコアリングコードにアクセスします。
デプロイデータのエクスポート¶
一般提供機能になりました。デプロイの[データエクスポート]タブでは、保存済みのトレーニングデータ、予測データ、実測値データをエクスポートして、カスタム指標タブまたはDataRobot外部でカスタムビジネスまたはパフォーマンス指標を計算および監視することができます。 指定したモデルと時間範囲について、利用可能なデプロイデータをエクスポートできます。 デプロイデータをエクスポートするには、デプロイが予測データを保存していることを確認して、必要な時間範囲のデータを生成し、そのデータを表示またはダウンロードします。
備考
デプロイデータのエクスポート機能の最初のリリースでは、行数制限があります。 詳しくは、この機能に関するドキュメントで注意事項をご覧ください。
詳しくはデータエクスポートタブのドキュメントをご覧ください。
カスタム指標の作成¶
一般提供機能になりました。デプロイのカスタム指標タブでは、データのエクスポートタブから収集したデータ(または他のカスタム指標で計算したデータ)を使用して、最大25個のカスタムビジネスまたはパフォーマンス指標を計算および監視することができます。 指標を追加してデータをアップロードすると、設定可能なダッシュボードによって指標の経時変化が可視化され、その情報を監視およびエクスポートできるようになります。 この機能により、組織固有の指標を実装して、DataRobotに組み込まれている[サービスの正常性] (service-health)、データドリフト、精度の各指標によって提供されるインサイトを拡張できます。
備考
カスタム指標機能の最初のリリースでは、行数とファイルサイズに制限が適用されています。 詳しくは、この機能に関するドキュメントで注意事項をご覧ください。
詳しくはカスタム指標タブのドキュメントをご覧ください。
データドリフトタブでのドリルダウン¶
現在、データドリフトタブで一般提供されている新しいドリルダウン可視化機能では、デプロイされたモデルのトレーニングデータセットと、本番環境での予測生成に使用されるデータセットの間の、時間経過に伴う分布の差異が追跡されます。 トレーニングデータセットで確立されたベースラインからのドリフトは、PSI(Population Stability Index)を用いて測定されます。 モデルが新しいデータで予測を続けると、追跡対象の特徴量ごとにドリフト状況の経時変化がヒートマップとして視覚化されます。 このヒートマップは、データドリフトを特定し、デプロイ内の特徴量間でドリフトを比較して、相関性のあるドリフトの傾向を確認するのに役立ちます。
さらに、ヒートマップから1つ以上の特徴量を選択して、特徴量ドリフトの比較チャートを表示できます。このチャートでは、基準期間と比較期間の間で特徴量のデータ分布の変化を比較して、ドリフトを視覚化できます。 この情報は、データ品質の問題、特徴量構成の変化、ターゲット特徴量のコンテキストの変化など、デプロイされたモデルでのデータドリフトの原因を特定するのに役立ちます。
詳細については、データドリフトタブでのドリルダウンのドキュメントを参照してください。
デプロイデータ処理の監視¶
一般提供機能になりました。使用状況タブでは、データドリフトタブと精度タブの予測データ処理についてレポートします。 デプロイされたモデルのデータドリフトと精度を監視することは、そのモデルが有効であり続けるために重要なタスクです。しかし、大量の予測データを処理する必要があり、遅延や速度制限の影響を受けることがあります。 使用状況タブの情報は、組織がこれらのデータ処理の問題を特定するのに役立ちます。 予測追跡チャートは、過去24時間または7日間の予測処理状況を示す棒グラフであり、処理済みの予測行、レート制限された予測行、および関連付けIDがない予測行の数を追跡します。
ページの右側には、予測値の処理(チャンピオン)と実測値の処理(実測値処理の遅延は、デプロイ内の全モデルが対象)の処理遅延が表示されます。
詳しくは使用状況タブのドキュメントをご覧ください。
デプロイ作成ワークフローの再設計¶
一般提供機能になりました。デプロイ作成ワークフローが刷新され、より整理された直感的なインターフェイスを提供します。 新しいデプロイを作成する場所(リーダーボード、モデルレジストリ、デプロイインベントリ)やアーティファクトのタイプ(DataRobotモデル、カスタム推論モデル、リモートモード)に関係なく、この新しいワークフローに移動します。 新たな設計では、提供したデータに基づいて、現在のデプロイの機能がわかりやすくまとめられています。設定と機能を論理的にグループ化して、ユーザーが機能を有効にしたときにすぐに確認したり、必須フィールドへの入力や必要な設定が行われていない場合にガイダンスを提供したりします。 新しいサイドバーには、デプロイレビューポリシーについての情報、デプロイへの課金の詳細(組織の設定による)、デプロイ情報ドキュメントへのリンクに加えて、デプロイでの予測に使用されているモデルに関する詳細が表示されます。
詳しくはデプロイの設定のドキュメントをご覧ください。
外部OAuthを使用してSnowflakeに接続¶
一般提供機能になりました。Snowflakeユーザーは、OAuthシングルサインオン(SSO)によるユーザー認証に外部IDプロバイダー(IdP:OktaまたはAzure Active Directory)を使用して、DataRobotでSnowflakeデータ接続を設定できます。
詳しくはSnowflakeの外部OAuthのドキュメントをご覧ください。
AIアプリにカスタムロゴを追加¶
一般提供機能になりました。AIアプリにカスタムロゴを追加できます。これにより、自社のブランドロゴをAIアプリに入れてから、社外・社内で共有することができます。
新しいロゴをアップロードするには、編集したいアプリケーションを開き、構築をクリックします。 設定 > 構成設定で、参照をクリックして新しい画像を選択するか、新しいロゴフィールドに画像をドラッグアンドドロップします。
詳細については、AIアプリのドキュメントを参照してください。
AIアプリでの多クラスのサポート¶
AIアプリは、多クラス分類のデプロイを3つのテンプレートタイプ(予測実行、最適化、What-If)すべてでサポートするようになりました。 これにより、より広範なビジネス上の問題を解決するアプリケーションを作成することができます。
プレビュー¶
スライスされたインサイトでモデルデータの部分母集団を表示¶
プレビュー版の機能です。スライスを使用すると、カテゴリー、数値、または両方の特徴量型のフィルターを定義できます。 プロジェクトのデータのセグメントに基づいてインサイトを表示および比較すると、モデルがさまざまな部分母集団でどのように動作するかを理解することができます。 スライスを「グローバル」スライス(すべてのトレーニングデータ)と比較することもできます(インサイトによります)。 スライスを設定することで、特徴量を選択し、演算子や値を設定して、返されるデータを絞り込むことができます。
リフトチャート、ROC曲線、残差、特徴量のインパクトの可視化では、スライスされたインサイトを利用できます。
必要な機能フラグ:スライスされたインサイトを有効にする
プレビュー機能のドキュメントをご覧ください。
期間精度を使用して、トレーニングデータの特定の期間に焦点を当てる¶
OTVや時系列のプロジェクトでプレビュー機能として利用できる期間精度のインサイトでは、データセット内で期間を定義し、その期間の指標スコアをモデル全体の指標スコアと比較できます。 期間は、プロジェクトの日付/時刻特徴量に基づいてグループ化する行を特定する、別のCSVファイルで定義されます。
アップロードされ、インサイトが計算されると、DataRobotは期間ベースの結果の表と各期間の「時間経過に伴う」ヒストグラムを提供します。
必要な機能フラグ:期間精度のインサイト
プレビュー機能のドキュメントをご覧ください。
サービスの正常性と精度の履歴を表示¶
プレビュー版の機能です。デプロイのサービスの正常性と精度を分析する際に、履歴タブを表示することで、現在および過去にデプロイしたモデルのパフォーマンスについて重要な情報を得ることができます。 このタブを使用すると、サービス正常性と精度の分析での操作性が向上し、最大5つのモデルを1つの場所で同じスケールで表示できるため、モデルのパフォーマンスを直接比較することが容易になりました。
デプロイのサービスの正常性 > 履歴タブでは、現在デプロイされているモデルを含む、最近デプロイされた最大5つのモデルのサービス正常性の履歴を表すビジュアライゼーションにアクセスできます。 この履歴は、モデルのサービス正常性で追跡される各指標で利用でき、適切なプロビジョニングに不可欠なボトルネックの特定と容量の評価に役立ちます。
デプロイの精度 > 履歴タブでは、現在デプロイされているモデルを含む、最近デプロイされた最大5つのモデルの精度履歴を表すビジュアライゼーションにアクセスでき、その精度を直接比較することができます。 これらの精度のインサイトは、問題のタイプとそれに関連する最適化指標に基づいてレンダリングされます。
必要な機能フラグ:デプロイ履歴を有効にする
プレビュー機能のドキュメントをご覧ください。
監視ジョブ定義の作成¶
プレビュー版の機能です。監視ジョブの定義により、DataRobotの外部で特徴量データと予測を実行・保存しているデプロイを監視し、デプロイと外部データソースをより密接に連携させることができます。 たとえば、Snowflakeに接続して、関連するSnowflakeテーブルから元データを取得し、監視目的でDataRobotにデータを送信する監視ジョブを作成することができます。
この連携により、batchPredictionJobDefinitions
とbatchPredictions
の既存の予測APIルートの機能が拡張され、batch_job_type:monitoring
プロパティが追加されました。 この新しいプロパティによって、監視ジョブを作成できます。 予測APIに加え、DataRobot UIを通じて、監視ジョブの定義を作成することができます。 その後、他のジョブ定義と同様に、監視ジョブの定義を確認および管理できます。
必要な機能フラグ:監視ジョブの定義
詳細については、予測監視ジョブのドキュメントを参照してください。
Snowflakeでスコアリングコードのデプロイと置換を自動化¶
現在、プレビュー機能として提供されており、DataRobotが管理するSnowflakeの予測環境を作成し、SnowflakeにDataRobotのスコアリングコードをデプロイすることができます。 DataRobotによる管理オプションを有効にすると、Snowflakeに外部デプロイされたモデルは、スコアリングコードの自動置換を含むMLOps管理機能を利用できます。
Snowflakeの予測環境を作成したら、モデルレジストリからその環境にスコアリングコード対応モデルをデプロイできます。
必要な機能フラグ:Snowflakeでのスコアリングコードの自動デプロイと置換を有効にする
プレビュー機能のドキュメントをご覧ください。
カスタムモデルのランタイムパラメーターを定義¶
プレビュー版の機能です。モデルのメタデータを通じてカスタムモデルにランタイムパラメーターを追加でき、カスタムモデルのコードが再利用しやすくなりました ランタイムパラメーターを定義するには、model-metadata.yaml
に以下の runtimeParameterDefinitions
を追加します。
キー | 値 |
---|---|
fieldName |
ランタイムパラメーターの名前 |
type |
ランタイムパラメーターに含まれるデータタイプ:string またはcredentials |
defaultValue |
(オプション)ランタイムパラメーターのデフォルト文字列値(credentialタイプはデフォルト値をサポートしません) |
description |
(オプション)ランタイムパラメーターの目的または内容の説明 |
カスタムモデルの作成時に、runtimeParameterDefinitions
を含むmodel-metadata.yaml
ファイルをDataRobotに追加すると、そのカスタムモデルのアセンブルタブにランタイムパラメーターセクションが表示されます。
詳しくはドキュメントをご覧ください。
サポート終了のお知らせ¶
DataRobot Primeモデルの作成を削除¶
このデプロイでは、新規にDataRobot Primeモデルを作成する機能が、アプリケーションから削除されました。 これは既存のPrimeモデルやデプロイには影響しません。 Rulefitモデルは、親モデルからの予測ではなく元のデータを予測ターゲットに使用する点のみがPrimeと異なり、Java/Pythonのソースコードのエクスポートをサポートしています。
記載されている製品名および会社名は、各社の商標または登録商標です。 製品名または会社名の使用は、それらとの提携やそれらによる推奨を意味するものではありません。