2024年8月
2024年8月¶
2024年8月28日
このページでは、新たにリリースされ、DataRobotのSaaS型シングル/マルチテナントAIプラットフォームで利用できる機能についてのお知らせと、追加情報へのリンクを掲載しています。 リリースセンターからは、次のものにもアクセスできます。
注目の新機能¶
ワークベンチでのカスタム特徴量セット¶
モデルの特徴量のインパクトのインサイト、時系列エクスペリメントでのクラスターのインサイトなど、ワークベンチのユースケースの複数の領域からカスタム特徴量セットを作成します。
動画:ワークベンチでのカスタム特徴量セット
8月リリースの機能¶
次の表は、新機能の一覧です。
目的別にグループ化された機能
名前 | 一般提供 | プレビュー |
---|---|---|
GenAI | ||
Azure OpenAI GPT-4 Turbo LLMに対応 | ✔ | |
アプリケーション | ||
カスタムアプリケーションソースの置換 | ✔ | |
データ | ||
ワークベンチで特徴量探索での関係性の自動生成 | ✔ | |
DataRobotでSAP Datasphereコネクターをサポート | ✔ | |
データ探索ページでEDAのインサイトを追加し、UIをさらに改善 | ✔ | |
モデリング | ||
時系列機能を一般提供。部分的な履歴しかない新しい系列のサポートを追加 | ✔ | |
ワークベンチで教師なしモデリングのサポートを開始 | ✔ | |
アプリケーションのログインプロセスを簡素化 | ✔ | |
データタブとカスタム特徴量セットの機能を一般提供 | ✔ | |
イテレーションの比較を目的とした、増分学習の新しいインサイト | ✔ | |
予測とMLOps | ||
デプロイのデータトレース | ✔* | |
バッチ予測のラングラーレシピ | ✔ | |
バッチ予測APIのマルチパートアップロード | ✔ | |
TTSモデルとLSTMモデルでのバッチ予測 | ✔ | |
SAP AI Coreでのスコアリングコードの自動デプロイと置換 | ✔* | |
Notebooks | ||
ノートブックのカスタム環境を作成 | ✔ | |
管理 | ||
DataRobot内でのパブリックリソースへのアクセスを制御するネットワークポリシーを管理 | ✔ |
- プレミアム機能
一般提供¶
Azure OpenAI GPT-4 Turbo LLMに対応¶
このデプロイでは、Azure OpenAIのGPT-4 Turbo LLMがプレイグラウンドから利用できるようになりました。これにより、生成AIのエクスペリメントを構築する際に選択でき、すぐに使えるLLMの数が増えました。 LLMの継続的な追加は、新たにリリースされ、利用可能なLLMを随時提供するというDataRobotの取り組みを示すものです。 利用可能なLLMのリストは、こちらで管理されています。
カスタムアプリケーションソースの置換¶
一般提供機能になりました。カスタムアプリケーションのアプリケーションソースを置き換えることができます。 これにより、アプリケーションのコード、基盤となる実行環境、ランタイムパラメーターなど、アプリケーションから多くの特性が引き継がれます。 ソースが置き換えられても、そのアプリケーションにアクセスできるすべてのユーザーは、引き続きアプリケーションを使用できます。
ワークベンチで特徴量探索での関係性の自動生成¶
ワークベンチで特徴量探索を行う場合、関係性の自動検出(ARD)を利用します。 ARDでは、レシピに追加されたプライマリーデータセットとすべてのセカンダリーデータセットを分析して、関係性を検出および生成します。 すべてのセカンダリーデータセットをレシピに追加した後、関係性の生成をクリックすると、セカンダリーデータセットがキャンバスに自動的に追加され、データセット間の関係性が設定されます。
アプリケーションのログインプロセスを簡素化¶
アプリケーションの認証にAPIキーが使用されるようになりました。これにより、ワークベンチやDataRobot Classicでアプリを作成した後、OAuth認証のプロンプトをクリックする必要がなくなりました。 アプリを作成したり、共有されているアプリにアクセスすると、APIキーのリストに新しいキー(AiApp<app_id>
)が表示されます。
時系列機能を一般提供。部分的な履歴しかない新しい系列のサポートを追加¶
このデプロイでは、ワークベンチに時系列機能が一般提供されました。 アップデートの一環として、予測機能に新しい履歴と部分的な履歴データのサポートが追加されました。 一部のブループリントでは、部分的な履歴しかない新しい系列について、最適ではない予測を返すことがあります。 このオプションを選択すると、DataRobotでは、不完全な履歴データ(トレーニングデータになかった系列(「コールドスタート」)、および系列の履歴が部分的にしかわからない予測データセット(過去の行は特徴量派生ウィンドウ内で部分的に利用可能))で予測できるモデルもトレーニングします。
ワークベンチで教師なしモデリングのサポートを開始¶
ワークベンチで、ターゲットを指定せず、データにラベルを付けない教師なし学習が可能になりました。 教師なし学習は、予測を生成する代わりに、データのパターンに関するインサイトを明らかにします。 予測と時間認識の両方のエクスペリメントで利用できる教師なし学習では、クラスタリングと異常検知が可能で、「データに異常はあるか?」や 「自然なクラスターはあるか?」といった質問に答えます。
モデルの構築が完了すると、教師なし固有のインサイトによって、特定されたパターンが明らかになります。
データタブとカスタム特徴量セットの機能を一般提供¶
UIを使用して既存の予測エクスペリメントに新しいカスタム特徴量セットを追加する機能が、プレビュー機能として4月に導入されました。 一般提供機能になりました。リーダーボードからアクセスできるエクスペリメント情報ウィンドウの特徴量セットまたはデータタブ(どちらも現在は一般提供)から、独自のセットを作成できます。 一括選択を利用すると、ワンクリックで複数の特徴量を選択できます。
デプロイのデータトレース¶
プレミアム機能です。生成AIデプロイのデータ探索タブで、トレースをクリックして、関連付けIDで一致するプロンプト、回答、ユーザー評価、およびカスタム指標を探索します。 このビューでは、生成AIモデルの回答の品質に関するインサイトが、ユーザーによる評価と、実装した生成AIのカスタム指標に基づいて提供されます。 プロンプト、回答、および利用可能な指標は、関連付けIDによって対応付けられます。
デフォルトではオフの機能フラグ: テキスト生成のターゲットタイプでデータ品質テーブルを有効にする(プレミアム機能)、生成モデルで実測値の保存を有効にする(プレミアム機能)
バッチ予測のラングラーレシピ¶
デプロイの予測 > 予測を作成タブを使用して、バッチ予測を行うことで、デプロイされたモデルでラングラーデータセットを効率的にスコアリングできます。 バッチ予測とは、大規模なデータセットで予測を行う方法で、入力データを渡すと各行の予測結果が得られます。 予測データセットボックスで、ファイルを選択 > ラングラーをクリックし、ラングラーデータセットで予測を行います。
ワークベンチでの予測
ラングラーは、ワークベンチでは予測データセットソースとしても使用できます。 デプロイ前のモデルで予測を行うには、エクスペリメントのモデルリストからモデルを選択し、モデルアクション > 予測を作成をクリックします。
予測データの送信元と送信先を指定し、予測が実行されるタイミングを決定することで、バッチ予測ジョブをスケジュールすることもできます。
バッチ予測APIのマルチパートアップロード¶
バッチ予測APIでは、マルチパートアップロードで複数のファイルを使用してスコアリングデータをアップロードすることで、大規模なデータセットのファイル取り込みを改善できます。 マルチパートアップロードプロセスでは、複数のPUT
リクエストの後に、手動でアップロードを完了するためのPOST
リクエスト(finalizeMultipart
)が必要です。 マルチパートアップロードプロセスは、低速接続で大規模なデータセットをアップロードしたい場合や、ネットワークが頻繁に不安定になる場合に役立ちます。
この機能により、バッチ予測APIに2つのエンドポイントが追加され、ローカルファイルアダプターに2つの新しい取り込み設定が追加されました。
TTSモデルとLSTMモデルでのバッチ予測¶
時系列予測では、従来の時系列モデル(TTS)や長・短期記憶モデル(LSTM)(自己回帰(AR)や移動平均(MA)の手法を用いたシーケンスモデル)が一般的です。 ARモデルもMAモデルも、予測を行うためには、通常、過去の予測の完全な履歴を必要とします。 それに対して、他の時系列モデルでの予測に必要なのは、特徴量派生後の1行のみです。 これまで、バッチ予測では、履歴が各バッチの最大サイズを超える場合、有効な 特徴量派生ウィンドウ(FDW)を超えて履歴データを受け入れることができませんでしたが、シーケンスモデルではFDWを超える完全な履歴データが必要でした。 これらの要件により、シーケンスモデルはバッチ予測とは相容れないものとなりました。 この機能によって、それらの制限が解除されるため、TTSおよびLSTMモデルでのバッチ予測が可能になります。
ノートブックのカスタム環境を作成¶
一般提供機能になりました。DataRobot NotebooksはDataRobotのカスタム環境と連携しており、ノートブックセッションを実行するための再利用可能なカスタムDockerイメージを定義できます。 カスタム環境では、環境設定を完全に制御し、ビルトインイメージで使用可能な依存関係に加えて、再現可能な依存関係を活用できます。 カスタム環境を作成したら、他のユーザーと共有したり、そのコンポーネントを更新して新しいバージョンの環境を作成したりすることができます。
プレビュー¶
DataRobotでSAP Datasphereコネクターをサポート¶
NextGenとDataRobot Classicの両方で、SAP Datasphereコネクターをプレビュー機能としてサポートするようになりました。
デフォルトではオフの機能フラグ: SAP Datasphereコネクターを有効にする
プレビュー機能のドキュメントをご覧ください。
データ探索ページでEDAのインサイトを追加し、UIをさらに改善¶
ワークベンチのデータ探索ページで、EDAのインサイトが追加され、UIがさらに改善されました。
- データ探索ページでは、左のパネルにあるアイコンを使用して、特徴量、特徴量セット、データプレビュー、情報のビュー間を移動できます。
- 新しい情報ビューには、データセットに関するサマリー情報が表示されます。
- 特徴量ビューとデータプレビュービューのフッターが新しくなりました。
- ラングリングされたデータセットには、右のパネルにレシピ操作が表示されます。
- 特徴量ビューで、特定の特徴量をクリックするとインサイトが表示されます。 得られるインサイトは、特徴量の型によって異なります。
- 集計されたカテゴリー特徴量のインサイトを確認する際に、選択されたキーのヒストグラムを表示できます。
デフォルトではオンの機能フラグ: ワークベンチでEDAインサイトを有効にする
プレビュー機能のドキュメントをご覧ください。
イテレーションの比較を目的とした、増分学習の新しいインサイト¶
増分学習でのモデルイテレーションのインサイトでは、トレーニングされたイテレーションを比較し、必要に応じて、別のアクティブなイテレーションを割り当てたり、トレーニングを継続したりすることができます。 今回、このインサイトに、データの視覚化を支援する学習曲線が追加されました。 チャートを見て得た情報で、たとえば、アクティブなイテレーションを変更したり、新しいイテレーションをトレーニングしたりして、エクスペリメントを続行することができます。
デフォルトではオンの機能フラグ: 増分学習を有効にする
プレビュー機能のドキュメントをご覧ください。
SAP AI Coreでのスコアリングコードの自動デプロイと置換¶
DataRobotが管理するSAP AI Core予測環境を作成して、SAP AI CoreでDataRobotスコアリングコードをデプロイします。 DataRobot管理を有効にすると、外部SAP AI Coreデプロイは、自動スコアリングコード置換を含むMLOps管理にアクセスできます。 SAP AI Coreの予測環境を作成したら、モデルレジストリからその環境にスコアリングコード対応モデルをデプロイできます。
デフォルトではオフの機能フラグ: SAP AI Coreでのスコアリングコードの自動デプロイと置換を有効にする
プレビュー機能のドキュメントをご覧ください。
DataRobot内でのパブリックリソースへのアクセスを制御するネットワークポリシーを管理¶
デフォルトでは、Notebooksを含むDataRobotの一部の機能で、DataRobot内から完全なパブリックインターネットアクセスが可能です。 DataRobot内でユーザーがアクセスできるパブリックリソースを制限するために、マルチテナントSaaSの管理者は、組織内のすべてのユーザーに対してネットワークアクセス制御を設定できます。
デフォルトではオンの機能フラグ: ネットワークポリシーの適用を有効にする
プレビュー機能のドキュメントをご覧ください。
サポート終了/移行ガイド¶
ADLS Gen2およびS3コネクターのバージョン¶
ADLS Gen 2(バージョン 2021.2.1634676262008および2020.3.1605726437949)とAmazon S3(バージョン2020.3.1603724051432)は使用非推奨になりました。 新しいバージョンのコネクターを使用して既存のデータ接続を再作成し、追加の認証メカニズム、バグ修正、およびNextGenでこれらの接続を使用する機能を活用できるようにすることをお勧めします。
以下のプレビュー機能フラグも無効になります。
- DataRobotコネクターを有効化する
- ADLS Gen2のOAuth 2.0を有効化
古いバージョンを使用して作成された既存の接続は、引き続き動作します。 ただし、DataRobotでは、これらの古いバージョンに対する機能強化やバグ修正は今後行いません。
記載されている製品名および会社名は、各社の商標または登録商標です。 製品名または会社名の使用は、それらとの提携やそれらによる推奨を意味するものではありません。