Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

2023年1月

2023年1月25日

このページでは、新たにリリースされ、マネージドAIプラットフォームで利用できる機能についてのお知らせと、追加情報へのリンクを掲載しています。 1月のデプロイにより、DataRobotのAIプラットフォームには、以下の一般提供およびパブリックプレビューの新機能が提供されました。 リリースセンターからは、次のものにもアクセスできます。

注目の新機能

DataRobot Notebooksにより、アプリケーションにおけるコードファーストエクスペリエンスがより充実したものになります。 Notebooksは、機械学習のライフサイクルを加速させるために、コードファーストのアプローチを用いて、コラボレーション環境を提供するという重要な役割を担っています。 何百行ものコードを削減し、データサイエンスのタスクを自動化し、ビジネスニーズに特化したカスタムコードワークフローに対応します。 詳しい説明は以下をご覧ください。

1月リリース

次の表は、新機能の一覧です。 過去の新機能のお知らせについては、デプロイ履歴を参照してください。また、以下のサポート終了のお知らせもご覧ください。

目的別にグループ化された機能
名前 一般提供 パブリックプレビュー
モデリング
クイックオートパイロットモードの改善によりエクスペリメントが高速化
時系列クラスタリングのエクスペリエンス向上
時系列で5GBに対応
時系列プロジェクトのクローン作成機能を一般提供
リーダーボードのモデルからAIアプリを作成
特徴量探索でのメモリーの改善
予測とMLOps
TTSモデルとLSTMモデルでのバッチ予測
Null補完に対応していないモデルでのコンプライアンスドキュメントの生成
テキスト特徴量の特徴量ドリフトのワードクラウド
MLOpsのデプロイログ
モデルパッケージアーティファクトの作成ワークフロー
カスタムモデルのためのGitHub Actions
パブリックプレビュー:DataRobot Notebooks

一般提供

クイックオートパイロットモードの改善により、エクスペリメントが高速化

今月のリリースから、クイックオートパイロットモードでは、AutoMLプロジェクトにおいて、モデルの構築とリーダーボードへの入力が1段階のモデリングプロセスで行われるようになりました。 新バージョンのクイックオートパイロットでは、すべてのモデルが最大サンプルサイズ(通常は64%)でトレーニングされます。 クイックモデルの具体的な実行回数は、プロジェクトやターゲットのタイプによって異なります。 DataRobotは、ターゲットやパフォーマンス指標など、さまざまな基準で実行するモデルを選択しますが、その名前が示すように、迅速なエクスペリメントをサポートするために、トレーニング実行時間が比較的短いモデルのみを選択します。 実行時の効率を最大限に高めるために、特徴量を削減した特徴量セットの自動生成とフィッティングが行われなくなったことに注意してください。 (特徴量を削減した特徴量セットのフィッティングには、モデルの再トレーニングが必要です。)

時系列クラスタリングのエクスペリエンス向上

このリリースでは、2022年9月に一般提供を開始した時系列クラスタリングの機能強化が行われました。 クラスタリングにより、類似した系列を簡単にグループ化して、データの理解を深めたり、時系列のセグメントモデリングへの入力として使用したりすることができます。 クラスタリングの強化点は以下のとおりです。

  • セグメントモデリングに結果を使用しない場合は、トグルで10%のクラスタリングバッファを制御します。

  • 余計な特徴量セットを省いたプロジェクトの設定や、ウィンドウの設定がわかりやすくなりました。

  • クラスタリングモデル、およびその結果として得られるセグメントモデルは、予測に同じ量のデータを使用します(サイズは元のクラスタリングモデルのトレーニングサイズに基づきます)。

時系列で5GBに対応

このデプロイにより、DataRobotマネージドAIプラットフォーム上の時系列プロジェクトは、最大5GBまでのデータセットをサポートできるようになりました。 これまで、クラウド上の時系列プロジェクトでの上限は1GBでした。 プロジェクトやプラットフォームに基づいた詳細な情報については、データセットの要件リファレンスを参照してください。

時系列プロジェクトのクローン作成機能を一般提供

一般提供機能になりました。教師なし、時系列、OTV、セグメントの各モデリングプロジェクトを複製(「クローン化」)することができます。 以前は、この機能はAutoMLの連続値および分類プロジェクトでのみ利用できました。 複製機能を使って、データセットだけ、あるいはさまざまなプロジェクト設定やアセットをコピーすることで、プロジェクトのエクスペリメントを迅速に進めることができます。

リーダーボード上のモデルからAIアプリを作成

リーダーボードでトレーニングされたモデルから直接AIアプリを作成できるようになりました。 そのためには、モデルを選択して、新しいアプリを構築タブをクリックし、ユースケースに最も適したテンプレートを選択します。

次に、アプリケーションに名前を付け、アクセスタイプを選択し、作成をクリックします。

新しいアプリは、リーダーボードモデルのアプリを構築タブと、アプリケーションタブに表示されます。

詳細については、AIアプリのドキュメントを参照してください。

特徴量探索でのメモリーの改善

特徴量探索プロジェクトで使用されるメモリーが少なくなったため、全体的なパフォーマンスが向上し、エラーのリスクが減りました。

Null補完に対応していないモデルでのコンプライアンスドキュメントの生成

デフォルトのコンプライアンスドキュメントの自動生成テンプレートで感度分析セクションを生成するには、カスタムモデルがNull値補完(NaN値の補完)をサポートしている必要があります。サポートしていない場合、コンプライアンスドキュメントの生成は失敗します。 カスタムモデルがNull補完に対応していない場合、専用のテンプレートを使用してコンプライアンスドキュメントを生成できます。 レポートテンプレートドロップダウンリストで、コンプライアンスドキュメントの自動生成(Null値を補完しないモデルが対象)を選択します。 このテンプレートは、感度分析レポートを含まず、カスタムモデルでのみ利用可能です。 詳細については、コンプライアンスドキュメントの生成に関する情報を参照してください。

備考

このテンプレートオプションがお使いのDataRobotのバージョンでは使用できない場合、連続値モデルのカスタムテンプレート、または二値分類モデルのカスタムテンプレートをダウンロードできます。

テキスト特徴量の特徴量ドリフトのワードクラウド

特徴量の詳細チャートは、トレーニング期間とスコアリング期間での特徴量のデータ分布の違いをプロットしたもので、トレーニングデータで特徴量値が示すレコードの割合とスコアリングデータでのレコードの割合を棒グラフで比較できます。 テキスト特徴量については、特徴量ドリフトの棒グラフがワードクラウドに置き換わりました。これにより、データ分布がトークンごとに可視化され、個々のトークンが特徴量のデータドリフトにどれだけ関与しているかが明らかになります。

テキスト特徴量の特徴量ドリフトワードクラウドにアクセスするには、ドリフト対応デプロイのデータドリフトタブを開いてください。 サマリータブの特徴量の詳細チャートで、ドロップダウンリストからテキスト特徴量を選択します。

備考

エクスポートボタンの横にある設定アイコン()をクリックして、テキスト特徴量をワードクラウドとして表示チェックボックスをオフにすると、特徴量ドリフトのワードクラウドを無効にして標準チャートを表示できます。

詳細については、特徴量の詳細チャートのテキスト特徴量のドキュメントを参照してください。

MLOpsのデプロイログ

新しいMLOpsログタブでは、重要なデプロイイベントを確認できます。 これらのイベントによって、デプロイの問題を診断したり、デプロイが現在の状態になるまでの操作の記録を提供したりすることができます。 各イベントには、タイプとステータスがあります。 イベントログは、イベントタイプ、イベントステータス、または発生時刻でフィルターできます。また、「イベントの詳細」パネルでイベントの詳細を確認できます。

MLOpsログにアクセスするには:

  1. デプロイのサービスの正常性ページで、ページ下部の最近のアクティビティセクションまでスクロールします。

  2. 最近のアクティビティセクションで、MLOpsログをクリックします。

  3. MLOpsログで、ログフィルターを設定します。

  4. 左側のパネルには、MLOpsログリストに、選択したフィルターが適用されたデプロイイベントが表示されます。 イベントごとに、イベント名とステータスアイコン、タイムスタンプ、およびイベントメッセージのプレビューを含むサマリーを確認できます。

  5. 調べたいイベントをクリックし、右側のイベントの詳細パネルを確認します。

詳細については、サービスの正常性タブのMLOpsログを表示のドキュメントを参照してください。

パブリックプレビュー

DataRobot Notebooks

DataRobotアプリケーションに、データサイエンス分析やモデリングのためのノートブックを作成・実行するためのブラウザー内エディターが追加されました。 Notebooksでは、計算結果をテキスト、画像、グラフ、プロット、表など、さまざまな形式で表示することができます。 オープンソースのプラグインを使用することで、出力表示をカスタマイズできます。 セルには、コーディングワークフローの注釈や説明のためのマークダウンリッチテキストを含めることもできます。 DataRobotでは、ノートブックを作成・編集すると、変更履歴が保存されるため、いつでも戻ることができます。

DataRobot Notebooksには、ノートブックの作成、アップロード、管理をホストするダッシュボードが用意されています。 個々のノートブックには、よく使われる機械学習ライブラリを備えた、コンテナ化された環境が組み込まれているため、数回のクリックで簡単に設定できます。 ノートブック環境はDataRobotのAPIとシームレスに統合され、セル関数のキーボードショートカット、インラインドキュメント、シークレット管理と自動認証のために保存された環境変数を利用できる、堅牢なコーディングエクスペリエンスを提供します。

パブリックプレビュー機能のドキュメントをご覧ください。

TTSモデルとLSTMモデルでのバッチ予測

時系列予測では、従来の時系列モデル(TTS)や長・短期記憶モデル(LSTM)(自己回帰(AR)や移動平均(MA)の手法を用いたシーケンスモデル)が一般的です。 ARモデルもMAモデルも、予測を行うためには、通常、過去の予測の完全な履歴を必要とします。 それに対して、他の時系列モデルでの予測に必要なのは、特徴量派生後の1行のみです。 これまで、バッチ予測では、履歴が各バッチの最大サイズを超える場合、有効な 特徴量派生ウィンドウ(FDW)を超えて履歴データを受け入れることができませんでしたが、シーケンスモデルではFDWを超える完全な履歴データが必要でした。 これらの要件により、シーケンスモデルはバッチ予測とは相容れないものとなりました。 このパブリックプレビュー機能を有効にすると、それらの制限が解除されるため、TTSおよびLSTMモデルでのバッチ予測が可能になります。

時系列のオートパイロットには、まだTTSモデルやLSTMモデルのブループリントが含まれていません。しかし、モデルリポジトリにあるモデルブループリントにアクセスすることができます。

TTSおよびLSTMモデルでバッチ予測を可能にするために、次のことが行われました。

  • バッチ予測を更新して、最大バッチサイズ (50MBまたは約100万行の履歴データと同等) までの履歴データを受け入れるようにしました。

  • TTSモデルを更新し、(完全な履歴が提供されない場合)不完全な履歴での再フィッティングを可能にしました。

予測時に十分な予測履歴を提供しない場合、予測の矛盾が発生する可能性があります。 TTSおよびLSTMモデルで精度を維持する方法については、予測精度に関する注意事項を参照してください。

この機能を有効にすると、デプロイされたTTSまたはLSTMモデルの予測 > 予測を作成タブと予測 > ジョブ定義タブにアクセスできます。

必要な機能フラグ:TTSとLSTMの時系列モデルのバッチ予測を有効にする

パブリックプレビュー機能のドキュメントをご覧ください。

モデルパッケージアーティファクトの作成ワークフロー

パブリックプレビュー機能で利用できるようになった、改善されたモデルパッケージアーティファクトの作成ワークフローにより、モデルレジストリ内のモデルとそれに関連付けられたモデルパッケージとの間のつながりが表示され、モデルデプロイまでの道のりが明確になりました。 この新しいアプローチを使用すると、モデルのデプロイ時に、モデルパッケージの詳細を提供し、モデルパッケージをモデルレジストリに追加して開始できます。 モデルパッケージを作成してビルドを完了させたら、 デプロイ情報を追加してデプロイできます。

  1. リーダーボードから、予測の生成に使用するモデルを選択し、予測 > デプロイをクリックします。 ベストプラクティスに従い、最初にデプロイのためのモデルを準備することを推奨します。 このプロセスでは特徴量のインパクトを実行し、削減した特徴量リストでモデルを再トレーニングして、さらに大きなサンプルサイズでトレーニングします。次に、サンプル全体(日付/時刻でパーティション分割されたプロジェクトの最新データ)でトレーニングします。

  2. モデルをデプロイタブで、必要なモデルパッケージ情報を提供し、登録してデプロイをクリックします。

  3. モデルの構築を許可します。 モデルのサイズによっては、ビルドステータスが反映されるまでに数分かかる場合があります。 デプロイする前に、モデルパッケージが準備完了ステータスになっている必要があります。

  4. モデルパッケージリストで、デプロイするモデルパッケージを見つけて、デプロイをクリックします。

  5. デプロイ情報を追加しデプロイを作成します。

  1. モデルレジストリ > モデルパッケージに移動します。

  2. デプロイするモデルパッケージのアクションメニューをクリックし、デプロイをクリックします。

    スターテス列には、モデルパッケージのビルドステータスが表示されます。

    N/Aステータスを持っているモデルパッケージをデプロイすると、ビルドプロセスが開始されます。

  3. デプロイ情報を追加しデプロイを作成します。

ヒント

モデルレジストリからモデルパッケージを開き、パッケージ情報 タブからデプロイすることもできます。

詳細については、モデルレジストリのドキュメントを参照してください。

カスタムモデルのためのGitHub Actions

カスタムモデルのアクションは、GitHub CI/CDのワークフローを通じて、DataRobotでカスタム推論モデルとその関連デプロイを管理します。 これらのワークフローでは、モデルやデプロイを作成または削除したり、設定を変更したりできます。 YAMLファイルで定義されたメタデータにより、カスタムモデルのアクションによるモデルとデプロイの制御が可能になります。 このアクションのほとんどのYAMLファイルは、カスタムモデルのリポジトリ内の任意のフォルダに配置できます。 YAMLは、これらのワークフローで使用されるエンティティが含まれているかどうかを判断するために、検索、収集、スキーマに対するテストが行われます。 詳細については、custom-models-actionリポジトリを参照してください ドキュメントで提供されている クイックスタートの例では、 datarobot-user-modelリポジトリPython Scikit-Learnモデルテンプレートを使用します。

ワークフローを設定し、DataRobotでモデルとデプロイを作成した後、モデルのバージョン情報とパッケージ情報、およびデプロイの概要からコミット情報にアクセスできます。

必要な機能フラグ:カスタムモデルのGitHub CI/CDを有効にする

詳細については、カスタムモデルドキュメントのGitHub Actionsを参照してください。

サポート終了のお知らせ

Python 2のサポート終了と削除の現在の状況

2023年01月リリースの時点で、Python 2の削除の状況は次のとおりです。

  • Python 2はプラットフォームから完全に削除されました。

  • すべてのPython 2プロジェクトが無効であり、コンピューティングワーカーはPython 2関連のジョブを処理できなくなりました。

  • 現在、すべてのPython 2デプロイが無効であり、DataRobotが実施する個別の移行計画の下で管理されない限り、予測リクエストに対するレスポンスとしてHTTP 405を返すようになりました。

  • ポータブル予測サーバー(PPS)のイメージにPython 2が含まれなくなり、デュアル推論モードを使用したPython 2モデルの処理ができなくなりました。 PPSのイメージは、Python 3モデルの予測リクエストにのみ対応します。

記載されている製品名および会社名は、各社の商標または登録商標です。 製品名または会社名の使用は、それらとの提携やそれらによる推奨を意味するものではありません


更新しました March 13, 2024