Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

マネージドAIプラットフォームリリース

このページでは、新たにリリースされ、DataRobotのSaaS型シングル/マルチテナントAIプラットフォームで利用できる機能についてのお知らせと、追加情報へのリンクを掲載しています。

今月のデプロイ

2023年10月25日

最新のデプロイでは、DataRobotのAIプラットフォームは、以下に示す新規GAおよびパブリックプレビュー機能を提供しました。 リリースセンターからは、次のものにもアクセスできます。

10月リリース

次の表は、新機能の一覧です。

目的別にグループ化された機能
名前 一般提供機能 パブリックプレビュー
データ
関係性の品質評価を高速化
Snowflakeのキーペア認証
AWS S3との接続の強化
Azure Databricksのより幅広いサポートをワークベンチに追加
モデリング
Document AIがPDFドキュメントをデータソースとしてサポート
クラスターモデルでの予測の説明の一般提供を開始
GPUの改善によりディープラーニングモデルのトレーニングを強化
SHAPベースの予測の説明をワークベンチに追加
アプリケーション
ワークベンチでの新しいアプリ体験
予測とMLOps
モデルパッケージアーティファクトの作成ワークフロー
新しいモデルレジストリでのバージョン管理のサポート
キー値でコンプライアンスドキュメントを拡張する
カスタムモデルのパブリックネットワークへのアクセス
ワークベンチにおけるトレーニングデータでの予測
カスタムモデルのデプロイステータス情報
クライアント側の集計での自動サンプリング
Apache Airflowの新しい演算子
バッチ予測でのDatabricks JDBCへの書き戻しをサポート
デプロイ予測のバッチ監視
集計を有効にした監視ジョブの精度
Notebooks
ノートブックジョブのスケジュール
DataRobot Notebooksのカスタム環境イメージ

一般提供機能

Document AIがPDFドキュメントをデータソースとしてサポート

DataRobot Classicで利用可能なDocument AIの一般提供を開始しました。Document AIは、手作業が多いデータ準備手順を増やさずに、未処理のPDFドキュメントでモデルを構築する方法を提供します。 Document AIは、大規模なコーパスに情報が分散している問題や、ドキュメントをデータソースとして効率的に利用するためのその他の障壁に対処して、データの準備を容易にし、PDFベースのモデルにインサイトを提供します。

クラスターモデルでの予測の説明の一般提供を開始

クラスタリングで予測の説明を使用すると、特定の行のクラスター割り当てに最も貢献した要因が明らかになります。 一般提供機能になりました。このインサイトによって、クラスタリングモデルの結果をステークホルダーにわかりやすく説明できます。また、影響の大きい要因が特定されるため、事業戦略に注力できます。

多クラス予測の説明とよく似た機能ですが、クラスではなくクラスターについてレポートします。クラスターの説明は、リーダーボードとデプロイの両方から入手できます。 この機能は、XEMPベースのすべてのクラスタリングプロジェクトで利用可能ですが、時系列では利用できません。

モデルパッケージアーティファクトの作成ワークフロー

一般提供機能になりました。モデルパッケージアーティファクトの作成ワークフローが改善されて、モデルレジストリ内のモデルとそれに関連付けられたモデルパッケージ間の接続が視覚化され、モデルデプロイへのパスがより明確かつ一貫性のあるものになりました。 この新しいアプローチでは、モデルをデプロイする際、モデルの詳細を提供し、モデルを登録することから始めます。 その後、モデルパッケージを作成し、作成が完了したら、デプロイ情報を追加することでモデルをデプロイできます。

  1. On the Leaderboard, select the model to use for generating predictions. DataRobot recommends a model with the Recommended for Deployment and Prepared for Deployment badges. 予測 > デプロイをクリックします。 選択したリーダーボードモデルにデプロイの準備済みバッジがない場合、デプロイの準備をクリックして、そのモデルに対してモデル準備プロセスを実行することを推奨します。

  2. モデルをデプロイタブで、必要なモデルパッケージ情報を提供し、登録してデプロイをクリックします。

  3. モデルの構築を許可します。 モデルのサイズによっては、ビルドステータスが反映されるまでに数分かかる場合があります。 デプロイする前に、モデルパッケージが準備完了ステータスになっている必要があります。

  4. モデルパッケージリストで、デプロイするモデルパッケージを見つけて、デプロイをクリックします。

  5. デプロイ情報を追加しデプロイを作成します。

詳しくは、完全なドキュメントをご覧ください。

新しいモデルレジストリでのバージョン管理のサポート

app.eu.datarobot.comで一般提供機能になりました。新しいモデルレジストリは、DataRobotで使用されるさまざまなモデルのための組織的ハブです。 モデルは、デプロイ可能なモデルパッケージとして登録されます。 These model packages are grouped into registered models containing registered model versions, allowing you to categorize them based on the business problem they solve. 登録されたモデルには、DataRobotのモデル、カスタムモデル、外部モデル、チャレンジャーモデル、および自動的に再トレーニングされたモデルをバージョンとして含めることができます。

この変更では、モデルレジストリ > モデルパッケージタブにあるパッケージは登録モデルに変換され、新しい登録済みのモデルタブに移行されます。 移行された各登録モデルには、登録されたモデルバージョンが含まれています。元のパッケージは、新しいタブでは、登録モデル名に追加されたモデルパッケージIDによって識別できます。

移行が完了すると、変更されたモデルレジストリでは、新しいバージョン管理機能と一元管理で、予測モデルと生成モデルの進化を追跡できます。 さらに、元のモデルと関連するデプロイの両方にアクセスでき、登録したモデル(およびそのモデルに含まれるバージョン)を他のユーザーと共有することができます。

今回の変更は、以前のモデルパッケージワークフローの変更に基づいており、デプロイするモデルを登録する必要があります。 To register and deploy a model from the Leaderboard, you must first provide model registration details:

  1. On the Leaderboard, select the model to use for generating predictions. DataRobot recommends a model with the Recommended for Deployment and Prepared for Deployment badges. The model preparation process runs feature impact, retrains the model on a reduced feature list, and trains on a higher sample size, followed by the entire sample (latest data for date/time partitioned projects).

  2. 予測 > デプロイをクリックします。 If the Leaderboard model doesn't have the Prepare for Deployment badge, DataRobot recommends you click Prepare for Deployment to run the model preparation process for that model.

    ヒント

    If you've already added the model to the Model Registry, the registered model version appears in the Model Versions list. You can click Deploy next to the model and skip the rest of this process.

  3. モデルをデプロイで、登録してデプロイをクリックします。

  4. 新規モデルの登録ダイアログボックスで、必要なモデルパッケージのモデル情報を入力します。

  5. レジストリに追加をクリックします。 The model opens on the Model Registry > Registered Models tab.

  6. While the registered model builds, click Deploy and then configure the deployment settings.

詳しくは、完全なドキュメントをご覧ください。

キー値でコンプライアンスドキュメントを拡張する

一般提供機能になりました。コンプライアンスドキュメントのテンプレートで参照するキー値を作成できます。 キー値の参照を追加すると、生成されたテンプレートに関連データが含まれるため、コンプライアンスドキュメントを完成させるために必要な手動編集が最小限に抑えられます。 モデルレジストリのモデルに関連付けられたキー値は、登録されたモデルパッケージに関する情報を含むキーと値のペアです。

カスタムコンプライアンスドキュメントのテンプレートを作成する際に、文字列、数値、ブール値、画像、データセットのキー値を含めることができます。

そして、サポートされているキー値を参照するカスタムテンプレートを使用してモデルパッケージのコンプライアンスドキュメントを生成すると、DataRobotは関連するモデルパッケージから一致する値を挿入します。たとえば、キー値に画像が添付されている場合、その画像が挿入されます。

詳しくは、完全なドキュメントをご覧ください。

カスタムモデルのパブリックネットワークへのアクセス

プレミアム機能として一般提供を開始しました。どのカスタムモデルにも完全なネットワークアクセスを有効にすることができます。 カスタムモデルを作成すると、パブリックネットワーク内の任意の完全修飾ドメイン名(FQDN)にアクセスできるため、サードパーティのサービスをモデルで利用できます。 または、モデルをネットワークから分離し、発信トラフィックをブロックしたい場合は、パブリックネットワークへのアクセスを無効にすると、モデルのセキュリティを強化できます。 カスタムモデルでこのアクセス設定をレビューするには、リソース設定の下のアセンブルタブで、ネットワークアクセスを確認します。

詳しくは、完全なドキュメントをご覧ください。

ワークベンチにおけるトレーニングデータでの予測

ワークベンチで一般提供機能になりました。エクスペリメントを作成してモデルをトレーニングした後、モデルアクション > 予測を作成からトレーニングデータで予測を行うことができます。

トレーニングデータで予測を行う場合、プロジェクトのタイプに応じて、以下のオプションのいずれかを選択できます。

プロジェクトタイプ オプション
AutoML 以下のトレーニングデータオプションのいずれかを選択します。
  • 検定
  • ホールドアウト
  • すべてのデータ
OTV/時系列 以下のトレーニングデータオプションのいずれかを選択します。
  • すべてのバックテスト
  • ホールドアウト

インサンプル予測のリスク

選択したオプションとモデルがトレーニングされたサンプルサイズによっては、トレーニングデータで予測するとインサンプル予測が生成されることがあります。つまり、モデルはトレーニング中にターゲット値が見えており、その予測は必ずしも十分に一般化できるとは限りません。 DataRobotでは、1つ以上のトレーニング行が予測に使用されていると判断された場合、オーバーフィットのリスク警告が表示されます。 これらの予測は、モデルの精度を評価するために使用すべきではありません。

詳しくは、完全なドキュメントをご覧ください。

カスタムモデルのデプロイステータス情報

一般提供機能になりました。DataRobotでカスタムモデルをデプロイすると、デプロイのステータス情報は、デプロイインベントリの新しいバッジ、デプロイの警告、MLOpsログのイベントに表示されます。

After you add deployment information and deploy a custom model, the Creating deployment modal appears, tracking the status of the deployment creation process, including the application of deployment settings and the calculation of the drift baseline. You can monitor the deployment progress from the modal, allowing you to access the Check deployment's MLOps logs link if an error occurs:

デプロイインベントリでは、デプロイ名列に以下のデプロイステータス値が表示されます。

ステータス バッジ
カスタムモデルのデプロイプロセスは、まだ処理中です。 現在、このデプロイを使用して予測を行ったり、アクティブなデプロイを必要とするデプロイタブにアクセスしたりすることはできません。
カスタムモデルのデプロイプロセスは、エラーで完了しました。 このデプロイでは予測を行うことができないかもしれません。ただし、このデプロイを非アクティブ化した場合、デプロイエラーを解決するまで再アクティブ化できません。 MLOpsログを確認して、カスタムモデルデプロイのトラブルシューティングを行う必要があります。
カスタムモデルのデプロイプロセスは失敗し、デプロイは非アクティブです。 現在、このデプロイを使用して予測を行ったり、アクティブなデプロイを必要とするデプロイタブにアクセスしたりすることはできません。 MLOpsログを確認して、カスタムモデルデプロイのトラブルシューティングを行う必要があります。

エラー発生または警告ステータスのデプロイでは、どのタブでもその警告から、サービスの正常性に関するMLOpsログのリンクにアクセスできます。 このリンクをクリックすると、サービスの正常性タブに直接移動します。

サービスの正常性タブの最近のアクティビティで、MLOpsログタブをクリックすると、イベントの詳細を表示できます。 イベントの詳細では、 "ログを表示"をクリックしてカスタムモデルのデプロイログにアクセスすることで、エラーの原因を診断できます。

クライアント側の集計での自動サンプリング

一般提供機能になりました。監視エージェントによる大規模な監視では、元の特徴量、予測値、実測値の自動サンプリングをサポートし、チャレンジャーモデルと精度追跡に対応します。 この機能を有効にするには、大規模監視を設定する際に、MLOPS_STATS_AGGREGATION_AUTO_SAMPLING_PERCENTAGE環境変数を定義し、アルゴリズムによるサンプリングを使ってDataRobotに報告する元データの割合を決定します。 さらに、サンプリングするデータを含む入力データの列を識別するようにMLOPS_ASSOCIATION_ID_COLUMN_NAMEを定義する必要があります。

詳しくは、完全なドキュメントをご覧ください。

Apache Airflowの新しい演算子

DataRobot MLOpsとApache Airflowの機能を組み合わせることで、モデルの再トレーニングと再デプロイのための信頼性の高いソリューションを実装できます。たとえば、モデルの再トレーニングと再デプロイは、スケジュールに従う、モデルのパフォーマンスが低下したときに行う、新しいデータが存在するときにパイプラインをトリガーするセンサーを使用して行う、のいずれかから選択できます。

Apache AirflowのDataRobotプロバイダーに、新しい演算子が追加されました。

  • StartAutopilotOperator DataRobotオートパイロットをトリガーして、モデルのセットをトレーニングします。
  • CreateExecutionEnvironmentOperator 実行環境を作成します。
  • CreateCustomInferenceModelOperator カスタム推論モデルを作成します。
  • GetDeploymentModelOperator デプロイの現在のモデルに関する情報を取得します。

新しい演算子の詳細については、ドキュメントを参照してください。

バッチ予測でのDatabricks JDBCへの書き戻しをサポート

このリリースから、バッチ予測のJDBCデータソースとして、Databricksがサポートされるようになりました。 バッチ予測でサポートされているデータソースの詳細については、ドキュメントを参照してください。

関係性の品質評価を高速化

SaaS版で一般提供機能になりました。関係性の品質評価の実行時間を短縮するため、DataRobotはプライマリーデータセットの約10%をサブサンプリングし、エンリッチメントレートの推定精度や評価結果に影響を与えることなく、計算を高速化しました。 評価が終了すると、サンプリングの割合がレポートの上部に表示されます。

Snowflakeのキーペア認証

一般提供機能になりました。Basic認証やOAuth認証の代わりに、キーペア認証方式(Snowflakeのユーザー名と秘密キー)を使用して、DataRobot ClassicとワークベンチでSnowflakeデータ接続を作成します。 キーペア認証では、セキュアな構成の共有も可能です。

ワークベンチでの新しいアプリ体験

一般提供機能になりました。DataRobotは、新たにワークベンチに効率的なアプリケーションエクスペリエンスを導入しました。貴重な情報のスナップショットを簡単に表示、探索、作成できるユニークな機能を利用できます。 このリリースには、以下の改善が実施されています。

  • アプリケーションのインターフェイスと作成ワークフローがシンプルになり、より直感的に操作できるようになりました。
  • アプリケーションの作成では、アプリケーションを支えるモデルに基づいて、特徴量のインパクトやROC曲線などのインサイトが自動的に生成されます。
  • ワークベンチのエクスペリメントから作成されたアプリケーションは、ワークベンチのアプリケーションビルダー以外では開かれなくなりました。

パブリックプレビュー

GPUの改善によりディープラーニングモデルのトレーニングを強化

今回のデプロイでは、パブリックプレビュー版のGPU機能が以下のように強化されました。

  • GPUトレーニング用のブループリントが追加され、MiniLM、Roberta、Tiny Bertの各フィーチャライザーが利用可能になりました。

  • プロジェクトに応じて:

    • クイックオートパイロットの実行中に、Keras Text Convolutional Neural Networkブループリントをトレーニングできます。
    • フルオートパイロットの実行中に、Image Finetunerブループリントをトレーニングできます。
  • GPUとCPUのバリアントがリポジトリで利用可能になり、どのワーカータイプでトレーニングするかを選択できるようになりました。

  • GPU variant blueprints are optimized to train faster on GPU workers.

パブリックプレビュー機能のドキュメントをご覧ください。

デフォルトではオフの機能フラグ:GPUワーカーを有効にする

SHAPベースの予測の説明をワークベンチに追加

SHAPベースの予測の説明では、各特徴量が特定の予測にどの程度寄与するかを推定し、平均値との差として報告します。 これらは直感的で、制限がなく(すべての機能について計算されます)、高速で、SHAPのオープンソースの性質上、透過的です。 このデプロイにより、ワークベンチにおいて、SHAPベースの説明が時系列以外のすべてのエクスペリメントでサポートされるようになりました。 モデル概要タブからアクセスできる、SHAPベースの説明には、モデルパフォーマンスに対する全般的な「直観」のプレビューが表示され、データセット全体についての説明を参照するためのオプションも用意されています。

パブリックプレビュー機能のドキュメントをご覧ください。

デフォルトではオンの機能フラグ:ワークベンチでSHAPを有効にする

Azure Databricksのより幅広いサポートをワークベンチに追加

パブリックプレビュー版の機能です。Azure Databricksに対する以下のサポートが、ワークベンチに追加されました。

  • 接続を介して追加されたデータは、動的データセットとして追加されます。
  • Azure Databricksのソースデータから直接サンプリングしたライブプレビューでデータを表示します。
  • Azure Databricksのデータセットに対してラングリングを実行します。
  • Azure Databricksと同様に、データレジストリで公開されたラングリングレシピをマテリアライズします。

パブリックプレビュー機能のドキュメントをご覧ください。

機能フラグ:

  • Databricksドライバーを有効にする
  • Databricksのラングリングを有効にする
  • ワークベンチでDatabricksのソース内マテリアライズを有効にする
  • ワークベンチで動的データセットを有効にする

AWS S3との接続の強化

新しいAWS S3コネクターがパブリックプレビュー版で利用可能になりました。パフォーマンスが強化され、一時的な資格情報やParquetファイルの取込みにも対応しています。

パブリックプレビュー機能のドキュメントをご覧ください。

機能フラグ:S3コネクターを有効にする

デプロイ予測のバッチ監視

パブリックプレビュー版の機能です。時間単位ではなくバッチ単位で整理された監視統計を表示できます。 With batch-enabled deployments, you can access the Predictions > Batch Management tab, where you can create and manage batches. その後、これらのバッチに予測を追加し、デプロイ内のバッチごとにサービスの正常性、データドリフト、精度、カスタム指標の統計情報を表示できます。 バッチを作成して、バッチに予測を割り当てるには、UIまたはAPIを使用します。 In addition, each time a batch prediction or scheduled batch prediction job runs, a batch is created automatically, and every prediction from the job is added to that batch.

デフォルトではオフの機能フラグ:デプロイのバッチ監視を有効にする、デプロイのバッチカスタム指標を有効にする

パブリックプレビュー機能のドキュメントをご覧ください。

集計を有効にした監視ジョブの精度

パブリックプレビュー版の機能です。集計を有効にした外部モデルの監視ジョブは、精度の追跡に対応できます。 Enable Use aggregation and configure the retention settings, indicating that data is aggregated by the MLOps library and defining how much raw data should be retained for challengers and accuracy analysis; then, to report the Actuals value column for accuracy monitoring, define the Predictions column and Association ID column.

Feature flag OFF by default: Enable Accuracy Aggregation

詳しくは、完全なドキュメントをご覧ください。

ノートブックジョブのスケジュール

パブリックプレビュー版の機能です。ノートブックを非対話モードでスケジュールどおりに実行することで、コードベースのワークフローを自動化できます。 ノートブックのスケジューリングは、DataRobot Notebooksインターフェイスから直接作成できるノートブックジョブによって管理されます。 Additionally, you can parameterize a notebook job to enhance the automation experience enabled by notebook scheduling. ノートブック内の特定の値をパラメーターとして定義することで、実行ごとに値を変更するためにノートブック自体を継続的に修正する必要がなく、ノートブックジョブの実行時にこれらのパラメーターに入力を提供できます。

パブリックプレビュー機能のドキュメントをご覧ください。

デフォルトではオフの機能フラグ:Notebooksのスケジューリングを有効にする

DataRobot Notebooksのカスタム環境イメージ

パブリックプレビュー版の機能です。DataRobot Notebooksと、ノートブックセッションの実行に使用される再利用可能なカスタムDockerイメージを定義するDataRobotカスタム環境を連携できます。 ノートブックセッションで使用するカスタム環境を作成することで、環境を完全に制御したり、ビルトインイメージで利用可能なもの以外にも再現可能な依存関係を活用したりすることができます。 互換性のあるカスタム環境は、ノートブックインターフェイスから直接選択できます。 DataRobot NotebooksはPythonとRのカスタム環境をサポートしています。

パブリックプレビュー機能のドキュメントをご覧ください。

デフォルトではオフの機能フラグ:Notebooksのスケジューリングを有効にする

記載されている製品名および会社名は、各社の商標または登録商標です。 製品名または会社名の使用は、それらとの提携やそれらによる推奨を意味するものではありません


更新しました November 17, 2023
Back to top