2024年7月¶
2024年7月24日
このページでは、新たにリリースされ、DataRobotのSaaS型シングル/マルチテナントAIプラットフォームで利用できる機能についてのお知らせと、追加情報へのリンクを掲載しています。 リリースセンターからは、次のものにもアクセスできます。
注目の新機能:ワークベンチで特徴量探索¶
ワークベンチでの特徴量探索の実行¶
ワークベンチで特徴量探索を実行し、複数のデータセットから新しい特徴量を発見および生成できます。 特徴量探索は、次の2つの場所で開始できます。
- データタブで、プライマリーデータセットとなるデータセットの右側にあるアクションメニュー > 特徴量探索をクリックします。
- 特定のデータセットのデータ探索ページで、データのアクション > 特徴量探索を開始をクリックします。
このページでは、セカンダリーデータセットを追加して、データセット間の関係性を設定できます。
特徴量探索を設定し、自動化された関係性評価を完了したら、すぐにエクスペリメントのセットアップとモデリングに進むことができます。 モデル構築の一部として、DataRobotはこのレシピを使って結合と集計を実行し、新しい出力データセットを生成します。このデータセットはデータレジストリに登録され、現在のユースケースに追加されます。
ドキュメントをご覧ください。
7月リリースの機能¶
次の表は、新機能の一覧です。
目的別にグループ化された機能
名前 | 一般提供 | プレビュー |
---|---|---|
生成AI | ||
プレイグラウンドに新たなLLMを追加 | ✔* | |
データ | ||
ワークベンチでの特徴量探索の実行 | ✔ | |
「データを追加」モーダルでデータ接続を検索 | ✔ | |
データレジストリのデータセットに対してラングリングを実行する。 | ✔ | |
管理 | ||
アプリケーションの表示にライトテーマを追加 | ✔ | |
モデリング | ||
データタブとカスタム特徴量セットの機能を一般提供 | ✔ | |
特徴量のインパクトからカスタム特徴量セットを作成 | ✔ | |
予測とMLOps | ||
カスタムモデルやタスクのためのリモートリポジトリファイルブラウザー | ✔ | |
サーバーレス予測の最小コンピューティングインスタンス数を設定 | ✔* | |
Notebooks | ||
Codespacesでのスケジュール作成 | ✔ | |
ポート転送を有効にして、ノートブックおよびCodespacesでWebアプリケーションにアクセス | ✔ |
_* プレミアム機能__
一般提供¶
プレイグラウンドに新たなLLMを追加¶
このデプロイでは、いくつかの新しい大規模言語モデル(LLM)がプレイグラウンドから利用できるようになりました。これにより、生成AIのエクスペリメントを構築する際に選択でき、すぐに使えるLLMの数が増えました。 これらのLLMの追加は、新たにリリースされ、利用可能なLLMを随時提供するというDataRobotの取り組みを示すものです。 新しいオプションは以下のとおりです。
- Anthropic Claude 3 Haiku
- Anthropic Claude 3 Sonnet
- Google Gemini 1.5 Flash
- Google Gemini 1.5 Pro
利用可能なLLMのリストは、こちらで管理されています。
アプリケーションの表示にライトテーマを追加¶
デフォルトではダークテーマで表示されるDataRobotアプリケーションの表示テーマを変更できるようになりました。 表示色を変更するには、右上のプロフィールアバターから、ユーザー設定 > システムに進み、テーマドロップダウンを使用します。
データタブとカスタム特徴量セットの機能を一般提供¶
UIを使用して既存の予測エクスペリメントに新しいカスタム特徴量セットを追加する機能が、プレビュー機能として4月に導入されました。 一般提供機能になりました。リーダーボードからアクセスできるエクスペリメント情報ウィンドウの特徴量セットまたはデータタブ(どちらも現在は一般提供)から、独自のセットを作成できます。 一括選択を利用すると、ワンクリックで複数の特徴量を選択できます。
「データを追加」モーダルでデータ接続を検索¶
ワークベンチの「データを追加」モーダルでは、既存の全接続のリストをスクロールする代わりに、特定のデータ接続を検索できます。
特徴量のインパクトからカスタム特徴量セットを作成¶
モデル概要からアクセスできる特徴量のインパクトのインサイトから、特徴量の相対的なインパクトに基づいて特徴量セットを作成できるようになりました。 NextGenの他の特徴量セット作成オプションと同じ使い慣れたインターフェイスを使用して、特徴量のインパクトで作成されたセットをエクスペリメント全体で利用できます。
Codespacesでのスケジュール作成¶
一般提供機能になりました。Codespaceでノートブックを非対話モードでスケジュールどおりに実行することで、コードベースのワークフローを自動化できます。 スケジュールはノートブックジョブによって管理され、codespaceがオフラインの場合にのみ、新しいノートブックジョブを作成できます。 また、ノートブックをパラメーター化することで、ノートブックのスケジューリングによって可能になる自動化を強化できます。 Codespace内の特定の値をパラメーターとして定義することで、実行ごとに値を変更するためにノートブック自体を継続的に修正する必要がなく、ノートブックジョブの実行時にこれらのパラメーターに値を入力できます。
カスタムモデルやタスクのためのリモートリポジトリファイルブラウザー¶
このリリースから、DataRobot Classicのカスタムモデルワークショップにモデルやタスクを追加する際に、Bitbucket、GitHub、GitHub Enterprise、S3、GitLab、GitLab Enterpriseなどのリモートリポジトリ内のフォルダーやファイルを参照して選択できます。 リモートリポジトリからプルする場合、カスタムモデルにプルしたいファイルやフォルダーのチェックボックスをオンにしたり、リポジトリ内のすべてのファイルを選択したりすることができます。
備考
この例ではGitHubを使用していますが、各リポジトリタイプで手順は同じです。
プレビュー¶
データレジストリのデータセットに対してラングリングを実行する。¶
データレジストリに保存されたデータセットに対して、ラングリングレシピを構築し、プッシュダウンを実行できるようになりました。 データレジストリのデータセットに対してラングリングを実行するには、まずユースケースにデータセットを追加する必要があります。 次に、データセットの横にあるアクションメニューからラングリングを開始します。
この機能は、マルチテナントSaaSをご利用の場合と、AWS VPCまたはGoogle VPC環境のプラットフォームでのみ利用可能です。
プレビュー機能のドキュメントをご覧ください。
ポート転送を有効にして、ノートブックおよびCodespacesでWebアプリケーションにアクセス¶
ノートブックとCodespacesの環境設定で、ポート転送を有効にして、MLflowやStreamlitなどのツールやライブラリによって起動されるWebアプリケーションにアクセスできるようになりました。 ローカルで開発する場合、Webアプリケーションはhttp://localhost:PORT
でアクセスできます。しかし、ホストされたDataRobot環境で開発する場合、Webアプリケーションにアクセスするには、そのアプリケーションが実行されている(セッションコンテナ内の)ポートを転送する必要があります。
プレビュー機能のドキュメントをご覧ください。
デフォルトではオンの機能フラグ:セッションポート転送を有効にします
サーバーレス予測の最小コンピューティングインスタンス数を設定¶
プレミアム機能です。DataRobotサーバーレス予測環境を作成する際、最小コンピューティングインスタンス数の設定をデフォルトの0
から増やすことができます。 この設定には、0
から8
までの数値を指定できます。 最小コンピューティングインスタンス数を0
(デフォルト)に設定すると、推論サーバーは、30分以上の非アクティブ期間の後に停止します。
プレビュー機能のドキュメントをご覧ください。
記載されている製品名および会社名は、各社の商標または登録商標です。 製品名または会社名の使用は、それらとの提携やそれらによる推奨を意味するものではありません。