MLOps(V7.3)¶
2021年9月13日
DataRobot MLOps v7.2リリースには、以下に示す多くの新機能が含まれています。
リリースv7.2では、以下の言語のUI文字列の翻訳が更新されています。
- 日本語
- フランス語
- スペイン語
新機能と機能強化¶
以下の新しい機能の詳細を参照してください:
新しいデプロイ機能¶
リリースv7.2では、以下の新しいデプロイ機能が導入されました。
リモートモデルの精度ベースラインの設定¶
現在の正規版では、ホールドアウトデータをアップロードすることで、リモートの予測環境で稼働するモデルの精度ベースラインを設定することができます。外部モデルパッケージを登録する時にホールドアウトデータを提供し、予測値が含まれる列を指定してください。追加後、チャレンジャーモデルと外部デプロイ用のとターゲットドリフトを有効にすることができます。
デプロイレポート¶
現在の正規版では、サービスの正常性、データドリフト、精度統計に関するインサイトなど、デプロイのステータスに関する重要な統計情報を詳細に記述したデプロイレポートをオンデマンドで生成できます。さらに、定義された条件(頻度、時間、および曜日)に基づいてデプロイレポートを自動的に生成するポリシーとして機能するレポートスケジュールを作成できます。ポリシーがトリガーされると、DataRobot は新しいレポートを生成し、デプロイにアクセスできる人にメール通知を送信します。
MLOps管理エージェント¶
現在、パブリックプレビュー版として提供されている管理エージェントは、あらゆるタイプのインフラへのモデルのデプロイを自動化するための標準的なメカニズムを提供します。自動デプロイと自動モニタリングを組み合わせることで、本番環境のリモートモデルにかかる負担を軽減することができます。これは、チャレンジャーや再トレーニングなどの重要なMLOps機能で特に重要となります。DataRobotアプリケーションからアクセスするエージェントには、カスタム構成をサポートする各種プラグインが含まれています。加えて7.2では、モデルの起動イベントと置き換えイベントをよりよく理解するための機能が強化されており、エージェントが使用する予測環境のサービスアカウントを設定できるようになりました。
パブリックプレビュードキュメント
自動再トレーニング(Continuous AI)の機能強化¶
オートパイロットとモデル選択オプションの追加に対応するために、自動再トレーニングの機能が強化されました。再トレーニングはどのオートパイロットモードでも実行可能となり、トップモデルからアンサンブルを作成できるようになりました。さらに、モデリング時にSHAP値対応のモデルのみを検索したり、ターゲットリーケージを除去した特徴量セットを使用したりすることも可能です。これらのモデリングオプションの強化により、モデリングおよびデプロイ後のエクスペリエンスを改善できます。マネージドAIクラウドを使用する場合には、時系列のデプロイメントで自動再トレーニングも使用できるようになりました。
パブリックプレビュードキュメント
新しい予測機能¶
リリースv7.2では、以下の新しい予測機能が導入されました。
スケジュールされたバッチ予測とジョブの定義¶
デプロイの予測を作成タブからは、APIを使用せずにMLOpsから直接JDBCジョブおよびクラウドストレージ予測ジョブを作成およびスケジュールできるようになりました。また、ジョブ定義を柔軟なテンプレートとして使用して、バッチ予測ジョブを作成することもできます。その後は、DataRobot内部に定義を保存し、ワンクリック、APIコール、またはスケジュールを介した自動的操作で、新たなジョブを実行できるようになります。
Snowflakeのスコアリングコード¶
現在の正規版では、Snowflakeの新しいJava UDF機能を使用して、DataRobotのスコアリングコードをSnowflake内から直接実行できます。この機能により、Snowflakeからデータを抽出して読み込む必要がなくなり、大規模なデータセットをスコアリングするためのルートがはるかに高速になります。
ポータブルバッチ予測¶
ポータブル予測サーバーを追加のコンテナと組み合わせて、ファイルストレージ、JDBC、およびクラウドストレージを使用してバッチ予測ジョブを調整できるようになりました。ポータブル予測サーバーの利用時に、予測の大規模なバッチ処理を手動で管理する必要がなくなりました。さらに、データまたはその近く、またはパブリックインターネットにアクセスできないファイアウォールの背後にある環境に大規模なバッチ予測ジョブを配置できます
バッチ予測用のBigQueryアダプター¶
現在、パブリックプレビュー機能として提供されているDataRobotでは、バッチ予測向けのBigQueryをサポートしています。BigQuery REST APIを使用して、非同期ジョブとしてテーブルからGoogle Cloud Storage(GCS)にデータをエクスポートしたり、GCSアダプターでデータをスコアリングしたり、バッチローディングジョブでBigQueryテーブルを一括更新したりすることができます。
スコアリングコードの「予測の説明」への対応を含める¶
DataRobot、ポータブル予測サーバー、そして今回のJava スコアリングコード(またはSnowflakeで実行された場合)など、モデルをデプロイしたあらゆる場所で予測の説明を受け取ることができるようになりました。予測の説明は、予測に対する効果特徴量の定量的なインジケーターを提供するので、特定のモデルで特定の予測が作成された理由を知ることができます。パブリックプレビュー機能として使用可能になりました。スコアリングコードを介してモデルをダウンロードするときにポータブル予測タブで予測の説明を有効にすることができます。
新しいモデル登録機能¶
リリースv7.2では、以下の新しいモデルレジストリ機能が導入されました。
改善されたカスタムモデルのパフォーマンステスト¶
カスタムモデルのテストフレームワークが強化され、モデルテストの設定、実行、履歴の確認を行う時のエクスペリエンスが向上しました。モデルのメモリーとレプリカを設定し、望ましい予測SLAを実現します。個々のテストから、具体的なインサイトを入手できるようになりました。例えば、パフォーマンスチェックインサイトでは、ペイロードのサンプルサイズを変えた場合の予測レイテンシーのタイミングが表に表示されます。
カスタムモデルのテストに関するドキュメンテーション
モデルレジストリのコンプライアンスドキュメント¶
パブリックプレビュー機能として利用可能になりました。モデルレジストリからモデルの自動コンプライアンスドキュメントを生成して、組織に必要となる可能性があるデプロイ前のレビューと署名をより迅速に行えるようになりました。DataRobotは、モデル開発に関連する多くの重要なコンプライアンスタスクを自動化することによって、規制の厳しい業界でデプロイまでの時間を短縮できます。各モデルに対して個々のドキュメントを生成し、効果的なモデルリスク管理に関する包括的なガイダンスを提供できます。レポートは、編集可能なMicrosoft Wordドキュメント(DOCX)としてダウンロードできます。生成されたレポートには、規制への準拠要求に応じた適切なレベルの情報および透明性が含まれます。
モデルレジストリからコンプライアンスドキュメントを生成する方法を参照してください。
GitLabによるカスタムモデルにファイルを追加¶
ワークショップにカスタムモデルを追加する際に、Gitlab CloudとGitlab Enterpriseのリポジトリを使ってアーティファクトをプルし、それをカスタムモデルの構築に使用できるようになりました。リポジトリを登録して認証し、ファイルをカスタムモデルワークショップに組み込みます。
新しいガバナンス機能¶
リリースv7.2では、次のパブリックプレビュー機能が導入されています。
デプロイのバイアスと公平性の監視¶
現在の正規版にあるMLOpsの「バイアスと公平性」では、デプロイされた運用モデルの公平性を時系列で監視し、モデルが保護対象クラスに対して異なる動作を始めたときに通知を受け取ることができるようになります。
ガバナンスレンズでデプロイインベントリを表示すると、公平性の列には、公平基準に基づいて各デプロイがどのように実行されているかが一目でわかるように表示されます。
失敗したテストを調査するには、インベントリリストでデプロイをクリックして公平性タブに移動します。DataRobotは保護された各特徴量に対してクラスごとのバイアスと時間経過に伴う公平性を計算します。これにより、デプロイ済みのモデルが事前定義された許容バイアス基準を満たさなかった理由を理解することができます。
GAドキュメント(7.3時点)