Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

バージョン8.0.0

2022年3月14日

DataRobot v8.0.0リリースには、このセクションで説明する多くの新しいAutoML機能と機能強化が含まれています。時系列(AutoTS)およびMLOpsのリリースノートで説明されている新機能も参照してください。

リリースv8.0では、以下の言語のUI文字列の翻訳が更新されています。

  • 日本語
  • フランス語
  • スペイン語
  • 韓国語

有効期限切れが近い古い機能に対するDataRobotのサポート変更については、使用非推奨に関する重要な告知​を参照してください。このドキュメントには、DataRobotの修正された​問題も記載されています。

データの強化

Azure SynapseとSQLにActive Directoryのサポートを追加

DataRobotは、データソースとしてMicrosoft Azure SynapseとAzure SQLをサポートするようになりました。新しいデータ接続を追加する際に、両方のタイルが使用可能なストアの一覧に表示されます。

接続のパラメーターを定義する際に、認証方法をSqlPasswordまたはActiveDirectoryPasswordに指定できます。ActiveDirectoryPasswordを選択すると、データベースで定義されている資格情報の代わりにAzure IDを使用できます。Active Directoryの詳細については、クライアントのセットアップ要件を参照してください。

DataRobotとバッチ予測でExasol JDBCドライバーをサポート

DataRobotは、データソースとして最新バージョンのExasol JDBCドライバーをサポートするようになりました。新しいデータ接続を追加する際に、Exasolのタイルが使用可能なストアの一覧に表示されます。データ接続を設定すると、Exasolデータベースとの間でスコアリングするバッチ予測ジョブを作成できます。

Google CloudとAzure StorageのSDKがアップグレードされ、信頼性が向上

ストレージは、DataRobotインフラストラクチャの基本的な部分で、データセット、モデル、インサイトなどの保存に使用します。ストレージサブシステムの信頼性とパフォーマンスを維持するために、DataRobotではオンプレミスインストール用にGoogle CloudとAzure StorageのSDKのバージョンをアップグレードしました。

バッチ予測用のデータソースリストを検証および更新

DataRobotは、バッチ予測に対応する既存のデータソースを検証し、新しいデータソースのサポートを追加しました。最新のリストについては、バッチ予測に対応するデータソースを参照してください。

特徴量探索機能

特徴量探索の特徴量派生プロセスの改善

DataRobotは、特徴量派生ウィンドウ(FDW)が大きすぎて計算が非常に複雑になる場合や、列が時間インデックスと結合列の両方に設定されている場合、関係性の定義後に特徴量が生成されない可能性を低減しました。

モデリング機能

アプリケーションビルダーでのアプリケーションの複製

このリリースでは、既存のアプリケーションのコピーを作成できるため、新規ユーザーは、アプリのチャート、予測、シナリオ、シミュレーションなどのあらゆる側面の再作成に時間と労力を費やすことなく、既存の作業を活用できます。アプリケーションが共有されている場合、新規ユーザーが行った変更は、元のオーナーのアプリケーションに影響します。しかし、アプリケーションを複製してそのコピーを共有すれば、新規ユーザーは元のオーナーのアプリの作業を中断または変更することなく、既存のコンテンツにアクセスできるようになりました。

アプリケーションを複製するには、アプリケーション > 現在のアプリケーションに移動します。コピーするアプリのメニューアイコンをクリックして、複製を選択します。詳細については、アプリケーションの複製を参照してください。

アプリケーションビルダーの改善

このリリースでは、アプリケーションビルダーにいくつかの改善が加えられています。

  • アプリケーションの設定で、アプリケーション全体に表示する予測値の小数点以下の桁数を指定できるようになりました。

  • 単一レコードの予測を行う場合は、平均値を入力するをクリックして、各表示フィールドの平均特徴量値を入力します。

  • 二値分類プロジェクトの[すべての行]ウィジェットに[しきい値に対して調整された予測]列を追加できるようになりました。この列を追加するには、構築モードに移動し、すべての行ウィジェットを選択して、左側の管理をクリックします。しきい値に対して調整された予測の横にあるオレンジ色の矢印をクリックし、保存をクリックします。

  • アプリケーションでさらに多くの日付形式がサポートされるようになりました。

無制限のラベル数のサポートを一般提供

このリリースでは、多カテゴリーターゲットのサポートが強化され、任意の数のラベルが可能になりました(「無制限の多ラベルモデリング」)。以前は、プロジェクトで使用できるラベルは100個に制限されていました。DataRobotが多ラベルプロジェクトを構築する場合、各多カテゴリー特徴量で最大1,000のラベルを使用します。アプリケーションが不要なラベルを削除できるようにすることも、高度なオプションの特徴量制約セクションで削除するラベルを指定することもできます。さらに、予測 → ダウンロードからラベルごとのリフトチャートのエクスポートが可能になりました。

備考

多ラベルモデリングが利用できるかどうかは、お使いのDataRobotパッケージによって異なります。組織内で有効になっていない場合は、DataRobotの担当者に詳細をお問い合わせください。

AIカタログでのブループリント処理の改善

エラーのあるブループリントを特定できるようにしたことで、AIカタログから複数のブループリントを同時にトレーニングする(「一括トレーニング」)機能が向上しました。複数のブループリントをトレーニングモーダルには、トレーニングリクエスト内のブループリントのグループのステータスと影響を受けるブループリントの数を示す色分けされたメッセージが表示されます。エラーや警告にカーソルを合わせると、追加情報を含むツールチップが表示されます。

その他のユーザビリティの改善には、以下が含まれます。

  • 新しい一括削除機能では、削除するブループリントを複数選択してから、モーダルで削除対象のブループリントを確認することで、誤った削除操作を防止できます。
  • AIカタログからブループリントを選択する場合、選択したブループリントは、インベントリのページを移動しても保持されます。どのページからでも、トレーニング、検定、削除などの一括操作を適用できます。

ブループリントエディターの機能強化

このリリースでは、Composable MLに使用するブループリントエディターが改善されています。

ブループリントオブジェクトの追加および編集

ブループリントオブジェクトの追加と編集がより直感的になりました。以前のリリースでは、ノードのためのアクションにアクセスするには、ノードをクリックする必要がありました。今回のリリースから、ノードにカーソルを合わせるだけで、アクションにアクセスできるようになりました。また、コネクターに対して直接アクションを実行できるようになり、より直感的な操作が可能になりました。

ノードにカーソルを合わせると、以下に説明するアクションにアクセスできます。

アクションアイコン 説明
ノードの変更
ノードの追加
ノードの接続
ノードの削除。ノードを削除すると、それより下位のノードも削除されます。

コネクターにカーソルを合わせると、以下に説明するアクションにアクセスできます。

アクションアイコン 説明
ノードの追加
コネクターの削除

ブループリントの検定

ブループリントの検定も強化されました。注意(黄色で強調表示)を含むノードにカーソルを合わせると、注意メッセージが表示されます。注意を含むブループリントでトレーニングできるようになりました。これを行うには、トレーニング(注意あり)をクリックします。

データ型ノードの削除

データ型ノードを直接削除できるようになりました。

以前のリリースでは、データ型ノードを削除するには、利用可能な入力データウィンドウのチェックボックスをオフにする必要がありました。

詳細については、ブループリントの変更に関するドキュメントを参照してください。

あらゆる言語のマルチモーダルデータセットに対応するNLPファインチューニングブループリント

自然言語処理(NLP)は、自然言語を使用してコンピューターと人間との対話を処理し、すべてのAutoMLシステムにおいて不可欠なものです。ファインチューニングは、特定のタスクに対してトレーニング済みのモデルを使用し、2番目のデータセットが最初のデータセットと大きく異ならない限り、2番目の同様のタスクを実行するプロセスです。

NLPファインチューニングブループリントを使用すると、Visual Artificial Intelligence (AI)の既存機能と同様に、NLP用にトレーニング済みのモデルを使用してファインチューニングすることができます。これにより精度が向上し、特定のユースケースや下流のタスクに合わせてモデルを調整できます。NLPファインチューニングブループリントは、マルチモーダルデータセット、多ラベルデータセット、Composable MLにおいて任意の言語で利用できます。

外部予測インサイトの改善

高度なオプションの外部予測タブで、最大100個の外部予測列名を設定できるようになりました。

管理機能の強化

Python 3によるHadoopクラスターのサポート

Python 2のサポート終了に関するお知らせに続き、HadoopクラスターでPython 3がサポートされるようになりました。新規インストールでは、プロジェクトとモデルにPython 3を使用します。以前のリリースからアップグレードする場合は、Python 2とPython 3の両方が並行してサポートされるため、既存のプロジェクトは引き続き期待どおりに機能します。詳細については、サポート終了のお知らせとPython 3への移行ガイドを参照してください。次の使用非推奨の機能はPython 3プロジェクトではサポートされていませんが、これらの機能を含むPython 2プロジェクトでは期待どおりに機能します。

  • スケールアウトモデル
  • Hadoopスコアリング

RHEL 8.5をオンプレミスインストールでサポート開始

DataRobotは、インストールターゲットとしてRed Hat Enterprise Linux 8.4(RHEL 8.4)および8.5(RHEL 8.5)を正式にサポートするようになりました。また、CentOS Linux 8は2021年12月31日をもってサポート終了(EOL)となり、サポート対象外となりました。

アカウントとプロファイルの設定を再編成

ユーザーアカウント管理の利便性を向上させるため、プロフィールページには、これまで設定ページにあった設定など、個々のユーザー設定用の以下のタブが含まれるようになりました。

タブ 設定
アカウント 元のプロフィールページ設定。
セキュリティ 次のユーザー別のセキュリティ設定:
  • パスワードを変更する
  • 2要素認証
システム 次のユーザー別のシステム設定:
  • 言語
  • テーマ
  • CSVエクスポート
通知 次のユーザー別の通知設定:
  • すべてのメール通知をミュートする
  • オートパイロット終了時のEメール通知を有効にする
  • オートパイロット終了時のブラウザー通知を有効にする

適切なアクセス権と権限を持つユーザーは、設定ページで機能設定を表示および管理できます。他のすべてのユーザーには、設定ページは使用非推奨になっています。

APIの機能強化

以下は、APIの新機能と機能強化の概要です。各クライアントの詳細については、APIドキュメントのホームを参照してください。

ヒント

DataRobotでは、PythonおよびRのために最新のAPIクライアントに更新することを強くお勧めします。

新機能

APIリリースv2.28.0では、画像オーグメンテーションリストのサンプルを計算および取得するための新しいルートが導入されています。

  • POST /api/v2/imageAugmentationLists/(augmentationId)/samples/
  • GET /api/v2/imageAugmentationLists/(augmentationId)/samples/

機能強化

バージョン2.28.0では、取得したクラスターインサイトが最新であるかどうかの情報を新たに追加しています。

  • GET /api/v2/projects/(projectId)/models/(modelId)/clusterInsights/

リーダーボードアイテムに新しいプロパティbias_mitigationbias_mitigation_parent_lidが追加されました。

  • GET /api/v2/projects/(projectId)/models/(modelId)/

APIでの使用非推奨に関するお知らせ

customModelTypeパラメーターは、次のルートで使用非推奨になりました。今後のリリースで完全に削除される予定です。

  • POST /api/v2/customModels/

    • このエンドポイントは、カスタム推論モデルのみを作成します。
    • カスタムトレーニングタスク(customModelType=training)を作成するには、専用のcustomTasksエンドポイントPOST /api/v2/customTasks/を使用します。
  • GET /api/v2/customModels/

    • このエンドポイントは、カスタム推論モデルのみを一覧表示します。
    • カスタムトレーニングタスク(customModelType=training)を一覧表示するには、専用のcustomTasksエンドポイントGET /api/v2/customTasks/を使用します。

画像オーグメンテーションリストに関連しない画像オーグメンテーションサンプルのルートは使用非推奨になり、次のルートで削除される予定です。

  • POST /api/v2/imageAugmentationSamples/

    • 画像オーグメンテーションサンプルを作成するには、画像オーグメンテーションリストを作成し、エンドポイントPOST /api/v2/imageAugmentationLists/(augmentationId)/samples/を使用してそのサンプルを生成します。
  • GET /api/v2/imageAugmentationSamples/(samplesId)/

    • 画像オーグメンテーションサンプルを取得するには、エンドポイントGET /api/v2/imageAugmentationLists/(augmentationId)/samples/を使用してサンプルを取得します。

パブリックプレビュー機能

ディシジョンインテリジェンスフローの改善

このリリースでは、ディシジョンインテリジェンスフローにいくつかの改善を加えました。

  • ルールノードでif/thenルールを並び替えできます。
  • ルールノードでは、global elseロジックを使用して、他のルールに含まれていない残りの値をグループ化できます。
  • 変換ノードを使用して、元のデータセットの特徴量や、フローに導入されたデータセットの特徴量をオーバーライドできます。

詳細については、パブリックプレビューのドキュメントを参照してください。

二値分類プロジェクトでバイアス軽減が可能に

バイアス軽減(リーダーボードモデルのバイアス動作を軽減する手法)が、パブリックプレビュー機能として利用できるようになりました。これは、ブループリントを前処理または後処理タスクで補強することにより、保護特徴量においてクラス間のバイアス低減を試みることで機能します。軽減は、自動(オートパイロットの一部として)または手動(オートパイロットの完了後)で適用できます。自動的に実行する場合は、高度なオプションでのバイアスと公平性設定の一部として軽減基準を設けます。それにより、オートパイロットは、上位3つのリーダーボードモデルに軽減を適用します。また、オートパイロットの完了後は、リーダーボードから入手できる、アンサンブル以外でバイアス未軽減のモデルに軽減を適用できます。最後に、バイアスと精度のインサイトから、軽減されたモデルと軽減されていないモデルを比較します。

詳細については、ドキュメントを参照してください。

使用非推奨のお知らせ

今後新しいリリースに移行する際に適切な計画を立てるには、次の点に注意してください。

TensorFlowブループリントは使用非推奨になり、まもなく削除される予定

TensorFlow(TF)ブループリントはこのリリースで使用非推奨になり、新規プロジェクトでの構築に使用できなくなりました。これらはKerasブループリントに置き換えられており、ほとんどの場合、速度と精度の両方でTFよりも優れています。既存プロジェクトの一部として作成されたTFブループリントは、引き続き正常に機能します。これらのブループリントは、新規・既存を問わず、ユーザーブループリントで検索できなくなりました。

特徴量ごとの予実の表示は使用非推奨になり、特徴量ごとの作用を推奨

リーダーボードの評価タブから利用できる特徴量ごとの予実の表示は使用非推奨になり、まもなく削除される予定です。モデル予測での特徴量のインパクトに関するインサイトについては、代わりに解釈 > 特徴量ごとの作用を使用してください。どちらの表示でも、モデルに依存しない特徴量の有用性が報告されます。EDA2中に計算される特徴量ごとの予実は、特徴量の有用性スコアに基づいて結果をグラフ化します。このスコアは、引き続きデータページで確認できます。特徴量ごとの作用は、特徴量のインパクトスコアに基づいてランク付けされ、特徴量値の変化がモデルの予測にどのように影響するかを示します。

特徴量ごとの予実は、オンプレミスリリース9.0.0で削除されます。マネージドAIクラウドユーザーの場合、特徴量ごとの予実は次の四半期中に削除されます。

お客様から報告された問題の修正

リリース7.3.5以降、以下の問題が修正されています。

プラットフォーム

  • EP-2285:テスト結果で、mongoバージョンにターゲットを設定できませんでした。
  • MODEL-8321:文字レベル解析器とNone以外の任意のトークン化方式を選択した際の内部サービスエラー(ISE)を修正しました。
  • VIZAI-3055:APIを介した多ラベルプロジェクトタイプではサポートされていないOTVまたはTSで多ラベルプロジェクトを作成する機能を削除しました。
  • VIZAI-3062:多ラベルプロジェクトで特徴量探索を有効にしました。

予測

  • PRED-7153:フローズンモデルが原因でリーダーボードの予測タブが正しく表示されない問題を修正しました。
  • PRED-7191:派生した特徴量をオプションのパススルー列として使用しようとした場合に、リーダーボードの予測を作成タブで発生する問題を修正しました。

更新しました August 8, 2023