Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

2024年9月

2024年9月

2024年9月25日

このページでは、新たにリリースされ、DataRobotのSaaS型シングル/マルチテナントAIプラットフォームで利用できる機能についてのお知らせと、追加情報へのリンクを掲載しています。 リリースセンターからは、次のものにもアクセスできます。

9月リリースの機能

次の表は、新機能の一覧です。

目的別にグループ化された機能
  • プレミアム機能

一般提供

Azure OpenAI GPT-4o LLMに対応

今回のデプロイから、Azure OpenAI GPT-4o(“omni”)LLMがプレイグラウンドから利用できるようになりました。 マルチモーダルのGPT-4oは、テキスト生成の高速化、オーバーヘッドの削減、英語以外の言語サポートの向上により、テキスト入力の効率化を実現します。 LLMの継続的な追加は、新たにリリースされ、利用可能なLLMを随時提供するというDataRobotの取り組みを示すものです。 利用可能なLLMのリストは、こちらで管理されています。

ワークベンチでのラングリング機能を強化

このリリースでは、ワークベンチのデータラングリングに以下の改善を行いました。

  • 特徴量の削除操作により、すべての特徴量を選択/選択解除することができます。
  • ラングリングセッションの開始時や実行中に、既存のレシピから操作をインポートできます。
  • ラングリングページのプレビュー設定ボタンから、ライブプレビューの設定にアクセスします。
  • アクションメニューから、操作の上/下への追加、レシピの上/下へのインポート、複製、特定の操作までのプレビューなど、個々の操作に対して追加のアクションを実行できます。これにより、さまざまな操作の組み合わせがライブサンプルにどのように影響するかをすばやく確認できます。

DataRobotでADLS Gen2コネクターを一般提供

ネイティブADLS Gen2コネクターのサポートが、DataRobotで一般提供されました。 さらに、AzureサービスプリンシパルとAzure OAuthの資格情報は、セキュアな構成を使用して作成および共有できます。

OTVおよび時系列プロジェクトのデータで予測の説明を計算

一般提供機能になりました。時系列およびOTVプロジェクトで予測の説明を計算できます。 具体的には、トレーニングデータのホールドアウトパーティションおよびセクションでXEMPベースの予測の説明を取得できます。 DataRobotは、トレーニングデータのバックテスト1の検定パーティションに対してのみ予測の説明を計算します。

増分学習でのクラスタリング

今回のデプロイでは、DataRobotの増分学習機能にK-Meansクラスタリングモデルのサポートが追加されました。 増分学習(IL)は大規模なデータセット(10GB〜100GB)に特化したモデルトレーニング方法であり、データをチャンク化してトレーニングのイテレーションを作成します。 これがサポートされていることで、より大きなデータセットで時系列以外のクラスタリングプロジェクトを構築でき、自然なセグメントのグループ化および識別によってデータの探索が可能です。

地理空間モデリングでトレーニングサイズを拡大

今回のデプロイから、DataRobot Classicの地理空間モデリング(Location AI)でサポートする最大行数を10万行から1000万行に引き上げました。 Location AIでは、一般的な地理空間形式を取り込むことができ、地理空間座標を自動的に認識した地理空間分析モデリングが可能です。 トレーニングデータのサイズが引き上げられたことで、モデル内で地理空間パターンを見つける能力が向上しました。

レジストリでのカスタムアプリケーションの管理

一般提供機能になりました。NextGenレジストリのアプリケーションページには、利用可能なカスタムアプリケーションとアプリケーションソースがすべて表示されます。 アプリケーションのソース(構築したいカスタムアプリケーションのファイル、環境、およびランタイムパラメーターが含まれます)を作成し、そこから直接カスタムアプリケーションを構築できるようになりました。 アプリケーションページを使って、共有や削除を行うことで、アプリケーションを管理することもできます。

一般提供機能として、codespaceでアプリケーションのソースを開いて管理でき、ソースのファイルを直接編集したり、新しいファイルをアップロードしたり、codespaceのすべての機能を使用したりできます。

Codespaceで予測APIスニペットを開く

Codespace予測APIのコードスニペットを開いて、スニペットを直接編集したり、他のユーザーと共有したり、追加のファイルを組み込んだりできるようになりました。 選択すると、codespaceのインスタンスが生成され、その中にスニペットがPythonファイルとして格納されます。 Codespaceでは、ファイルストレージに完全にアクセスできます。 アップロードボタンを使ってスコアリング用のデータセットを追加したり、スニペット実行後に予測出力(output.jsonoutput.csvなど)をcodespaceファイルのディレクトリに戻したりすることができます。

スタンドアロンのノートブックをcodespaceに変換

一般提供機能になりました。DataRobotでスタンドアロンのノートブックをcodespaceに変換し、永続的なファイルストレージやGitとの互換性といったワークフローの機能をさらに組み込むことができます。 これらのタイプの機能にはcodespaceが必要です。 ノートブックを変換する際、DataRobotは環境設定、ノートブックの内容、スケジュールされたジョブ定義など、多くのノートブックアセットを保持します。

時系列モデルパッケージの予測間隔

リモート予測環境でDataRobotの時系列モデルを実行し、そのモデルの時系列予測間隔(1~100)を計算するには、予測間隔の計算を有効にして、モデルのデプロイまたはリーダーボードからモデルパッケージ(.mlpkgファイル)をダウンロードします。 その後、DataRobotの外でポータブル予測サーバー(PPS)を使って予測ジョブを実行できます。

詳しくはドキュメントをご覧ください。

サーバーレスプラットフォームに最大数のコンピューティングインスタンスを設定

管理者は、組織単位でデプロイの最大コンピューティングインスタンス数の上限を引き上げることが可能になりました。 指定しない場合、デフォルトは8です。コンピューティングリソースの使用を制限するには、最大値を最小値と同じに設定します。

プレビュー

新しい操作、派生プランの自動化を時系列のデータラングリングに導入

今回のデプロイでは、時系列モデリングでの入力準備を支援するツールが既存のデータラングリングフレームワークに追加され、データの準備段階で時系列の特徴量エンジニアリングを実行できるようになりました。 この変更は、今月発表された基本的なラングリング機能の改善に合わせて行いました。 時系列特徴量の派生操作によって、入力データに対してラグやローリング統計を実行します。その際、提案された派生プランを使って特徴量を自動生成するか、特徴量の選択とタスクの適用を手動で行います。DataRobotでは新しい特徴量が構築され、ライブデータサンプルに適用されます。

これらの操作はどのレシピにも追加できますが、プレビューサンプルの方法を日付/時刻に設定すると、指定した設定に基づいて、DataRobotが特徴量変換を提案するオプションが有効になります。 自動化オプションを使用すると、予測距離に応じてデータが拡張されて、事前に既知の列(指定した場合)とナイーブベースライン特徴量が追加され、元のサンプルが置き換えられます。 完了後、必要に応じてプランを変更できます。

デフォルトではオンの機能フラグ:時系列データのラングリングを有効にする

プレビュー機能のドキュメントをご覧ください。

カスタムカテゴリー指標の作成

NextGenコンソールでは、外部指標の作成時に、デプロイのカスタム指標タブでカテゴリー指標を定義できます。 カテゴリー指標ごとに、最大10クラスまで定義できます。

デフォルトでは、これらの指標はカスタム指標タブの棒グラフに表示されます。ただし、 設定メニューからチャートタイプを設定できます。

詳しくはドキュメントをご覧ください。

DataRobotデータセットのラングリングのサポートを拡大

ワークベンチのデータレジストリに保存されたデータセットをラングリングする機能は、7月にプレビュー版として導入されましたが、現在はすべての環境でサポートされています。

ネットワークポリシーを管理して、公開リソースへのアクセスを制限

デフォルトでは、ノートブックを含むDataRobotの一部の機能において、DataRobotがデプロイされているクラスター内から完全なパブリックインターネットアクセスが可能です。ただし、管理者は、ネットワークアクセス制御を設定することで、ユーザーがDataRobot内でアクセスできる公開リソースを制限できます。 これを行うには、ユーザー設定 > ポリシーを開き、ネットワークポリシーの制御を有効にするの左側にあるトグルをオンにします。 このトグルがデフォルトでオンになっている場合、ユーザーはDataRobot内から公開リソースにアクセスできません。

デフォルトではオンの機能フラグ: ネットワークポリシーの適用を有効にする

プレビュー機能のドキュメントをご覧ください。

サポート終了/移行ガイド

Python 3プロジェクトでの時系列の精度データのストレージ

DataRobotでは、時系列の精度データのストレージタイプをMongoDBからS3に変更しました。

マネージドAIプラットフォーム(クラウド)では、デフォルトでBlob Storageが使用されます。 機能フラグBLOB_STORAGE_FOR_ACCURACY_OVER_TIMEが、機能アクセス設定から削除されました。


更新しました 2025年3月12日