予測¶
以下のセクションでは、DataRobotでの予測作成について説明します。
本機能の提供について
ユーザーがDataRobotのエクスポート可能なモデルや、モデル構築環境から分離した専用の予測環境にモデルをエクスポートできる独立した予測環境オプションは、マネージドAIクラウドでのデプロイには使用できません。
予測の概要¶
DataRobotでは、さまざまな方法でモデルから新しいデータ(スコアリング)の予測を取得することができます。
UIによる予測¶
予測を行う最もシンプルな方法は、UIを使用してデータのスコアリングをする事です。このオプションは、例えば、四半期のレポートを作成するためにExcelを使用する方にとって優れたものです。新しいデータをアップロードしてスコアリングし、DataRobotで予測を作成して結果をダウンロードできます。
モデルをデプロイするための予測サーバー¶
REST APIでDataRobot予測サーバーを使用すると、高度に自動化されたリアルタイムのスコアリング方法にアクセスします。この方法は、他のITシステム、アプリケーション、またはコードと簡単に統合し、DataRobotモデルをクエリーして予測を返すことができます。予測サーバーは、クラウド環境とオンプレミス環境の両方でホスティングできます。また、ポータブル予測サーバーを使用することもできます。ポータブル予測サーバーは、DataRobotの外部で主なインストール環境から切り離された状態で動作します。
モデルをデプロイするためのスコアリングコード¶
DataRobotからスコアリングコードをJavaまたはPythonでエクスポートして予測を作成できます。スコアリングコードには移植性があるので、任意のコンピューティング環境で実行できます。この方法は、REST APIのパフォーマンスを完全にサポートできないアプリケーションやネットワークアクセスが十分でない低レイテンシーアプリケーションの場合に便利です。
予測の作成およびモデルの正常性の監視¶
上記の方法のいずれかを使用する場合、DataRobotを使用すると、モデルをデプロイし、選択した期間の予測の出力結果とパフォーマンスを監視できます。
モデル管理プロセスの重要なところは、モデルが劣化し始めた時期を特定し、迅速に対処することです。トレーニングすると、モデルは、提供する新しいデータで予測することができます。ただし、新しい都市へのビジネスの拡大、新しい製品の市場参入、ポリシーやプロセスの変化など、予測データは時間とともに変化します。それが原因でデータドリフト(新しいデータが元のトレーニングデータから乖離すること)が発生することがあるため、時間の経過とともに予測パフォーマンスが低下したり、信頼性が低下したりする可能性があります。
デプロイダッシュボードを使用して、モデルのパフォーマンス指標(予測の応答時間、モデルの状態、精度、データドリフト分析など)を分析します。モデルが劣化した場合の一般的な対処方法は、新しいモデルを再トレーニングすることです。デプロイでは、モデルを再デプロイせずに置き換えることができるので、コードを変更する必要がないだけでなく、DataRobotは特定のユースケースで使用されたモデルの履歴全体を追跡して表すことができます。