Skip to content

データとモデリング(V11.1.0)

2025年7月17日

DataRobot V11.1.0リリースには、以下で説明するように、データ、モデリング、管理に関する多くの新機能と機能強化が含まれています。 リリース11.1のその他の詳細については、以下をご覧ください。

リリースv11.1.0では、以下の言語のUI文字列の翻訳が更新されています。

  • 日本語
  • フランス語
  • スペイン語
  • 韓国語
  • ブラジルポルトガル語

データ

ワークベンチでのJDBCドライバーへの接続

ワークベンチでは、サポートされているJDBCドライバーからスナップショットデータに接続して追加することができます。 ユースケースにデータを追加する際、JDBCドライバーが使用可能なデータストアにリストされるようになりました。

なお、JDBCドライバーから追加できるのはスナップショットデータだけです。

ワークベンチで動的データセットのサポートを一般提供

ワークベンチで動的データセットのサポートが一般提供されました。 動的データとは、たとえばプレビュー用のライブサンプルを作成する際に、DataRobotがリクエストに応じてプルするソースデータへの「ライブ」接続のことです。

ワークベンチでのデータ操作をさらに改善

このリリースでは、ワークベンチのデータ探索機能が以下のようにアップデートされました。

  • データセットを探索する際、サマリーを表示をクリックすると、特徴量数、行数、データ品質評価などの情報が表示されます。

  • 個々の特徴量を表示するときに表示する列を管理します。

AIカタログでのMongoベースの検索

AIカタログでは、セキュリティとパフォーマンスの向上のために、Mongoベースの検索が使用されるようになりました。 これまで、AIカタログではElasticsearchが使われていました。

非構造化データのサポート

このリリースでは、非構造化データをサポートするS3およびADLSのコネクターが追加され、ファイル、ドキュメント、メディア、その他の表形式以外の形式に対して一貫した読み取りアクセスが可能になりました。 新しいエンドポイントは、非構造化データの効率的なチャンク転送をサポートし、大規模なファイルのスケーラブルな取り込みと提供を可能にします。これにより、既存の構造化データのサポートを補完する、スケーラブルで維持管理が容易な統一されたデータ接続アプローチを実現します。

モデリング

ワークベンチでブレンダーを一般提供

アンサンブルモデルとも呼ばれるブレンダーは、ワークベンチでモデリング後の操作として使用できるようになりました。 複数のモデルの基本予測を組み合わせ、それらのモデルの検定セットからの予測でトレーニングすることで、ブレンダーは精度を高め、オーバーフィッティングを削減できる可能性があります。 複数のブレンド方法が用意されているため、時間を認識するエクスペリメントと時間を認識しないエクスペリメントの両方でブレンダーを作成できます。

リーダーボードのアクションメニューから2~8個のモデルを選択し、ブレンド方法を選択して、新しいモデルをトレーニングします。 トレーニングが完了すると、新しいブレンドモデルがリーダーボード上のリストに表示されます。

増分学習の改善によりエクスペリメントの開始を迅速化

増分学習(IL)は、10GB〜100GBのデータセットを利用する教師ありエクスペリメントに特化したモデルトレーニング方法です。 データをチャンク化し、トレーニングのイテレーションを作成することで、予測を行うための最適なモデルを特定できます。 このデプロイでは、大きな改善点が2つあります。

  • 静的(スナップショット)データセットの場合、EDA1の完了後にエクスペリメントの設定を開始できるようになりました。エクスペリメントのサマリーは、ほぼすぐに表示されます。 以前は、最初のチャンクがプロジェクトを開始するデータとして使用されていたため、(データセットのサイズによっては)最初のチャンクの作成に時間がかかることがありました。 EDAサンプルは、データセット全体を適切に表現しており、これを使用することで、設定を進め、エクスペリメントを迅速化することができます。 また、反復処理の効率と柔軟性が向上するため、データセット全体に設定を適用する前に最適な設定を見つけることができます。

  • 時間認識予測を作成するエクスペリメントのサポートが一般提供されました。

プラットフォーム

外部OAuthサーバー設定のサポート

今回のリリースでは、OAuthプロバイダーの管理ページが新たに追加され、クラスターのOAuthプロバイダーを設定、追加、削除、変更できます。

さらに、GoogleとBoxという2つの新しいOAuthプロバイダーのサポートが追加されました。 詳しくは、ドキュメントをご覧ください。

Snowflake接続のFIPSパスワード要件を更新

FIPS認証要件の改定に伴い、DataRobotでは、資格情報が連邦情報処理標準(FIPS)に準拠することが必須となりました。FIPSは、暗号モジュールが特定のセキュリティ要件の検証をクリアしていることを保証する米政府の規格です。 DataRobotで使用されるすべての資格情報、特にSnowflakeの基本資格情報とキーペアは、以下に示すFIPS準拠の形式に従う必要があります。

  • RSAキーの長さは2048ビット以上で、パスフレーズは14文字以上である必要があります。
  • Snowflakeのキーペア認証では、FIPS承認のアルゴリズムを使用し、ソルト長を16バイト(128ビット)以上にする必要があります。

詳細については、FIPS検証に関するFAQを参照してください。

SAML SSOテストの自動化

SSO管理ページからSAML SSO接続を設定した後、その接続の自動テストを実施できます。 テストを実行すると、管理者はユーザー資格情報を提供し、IdP側でログインプロセスを実行します。 テストが完了すると、成功メッセージが表示されるか、何が問題だったのかを示す警告メッセージが表示され、フィールドには間違った値がハイライトされます。

記載されている製品名および会社名は、各社の商標または登録商標です。 製品名または会社名の使用は、それらとの提携やそれらによる推奨を意味するものではありません