モデリング(V9.0)¶
次の表は、新機能の一覧です。 使用非推奨・サポート終了のお知らせもご覧ください。
一般提供¶
Visual Artificial Intelligence (AI)での画像埋め込みによる視覚化で新しいフィルター機能を追加¶
解釈 > 画像埋め込みタブは、AIプロジェクトの予測結果を視覚化するのに役立ちます。 DataRobotは画像の予測値を計算し、その予測値でフィルターできるようになりました。 さらに、一部のプロジェクトタイプでは、予測しきい値を変更し(予測ラベルが変更される場合があります)、新しい結果に基づいてフィルターすることができます。 以下の図は、サポートされているすべてのプロジェクトタイプについて、新規と既存のすべてのフィルターオプションを示しています。
また、クラスターの操作性が向上し、Visual Artificial Intelligence (AI)の結果をより簡単に探索できるようになりました。 クラスタリングを使用すると、予測されるクラスターを示す色付きの境界線が画像に表示されます。
バイアス軽減機能¶
バイアス軽減が、二値分類プロジェクトで一般提供機能として利用できるようになりました。 このリリースでは、親モデルとバイアス軽減が適用された子モデルの関係性を明確にするため、リーダーボード上の親モデルからアクセスできる軽減を適用したモデルテーブルが追加されました。
バイアス軽減は、ブループリントに対して前処理または後処理タスクでオーグメンテーションを行うことによって機能し、その後、ブループリントは保護された特徴量でクラス間のバイアスを減らすことを試みます。 軽減は、自動(オートパイロットの一部として)または手動(オートパイロットの完了後)で適用できます。 自動的に実行する場合、高度なオプションでのバイアスと公平性の設定の一部として、軽減基準を設定します。 その後、オートパイロットはリーダーボードの上位3モデルにバイアス軽減を適用します。 また、オートパイロットが完了したら、リーダーボードから入手できる、アンサンブル以外でバイアス未軽減のモデルに軽減を適用できます。 最後に、バイアスと精度のインサイトから、バイアスを軽減したモデルと軽減していないモデルを比較します。
詳しくはバイアス軽減をご覧ください。
テキスト予測の説明¶
テキスト予測の説明を使用すると、テキスト特徴量内の個々の単語 (n-gram) が予測にどのように影響するかを理解し、モデルとそれが単語に与える重要性を検証および理解するのに役立ちます。 これまで、DataRobotは、データセット内のテキストのインパクトを、テキスト特徴量全体のインパクトとして評価していたため、最良の理解のためには、テキスト全体を読むことが潜在的に求められてきました。 テキスト予測の説明では、青(ネガティブ)から赤(ポジティブ)への標準的なカラーバースペクトルでインパクトを表すため、テキストを簡単に視覚化して理解できます。 不明なn-gramを表示するオプションは、モデルで認識されなかったn-gram(トレーニング中に表示されなかったことが主な理由と思われます)をグレーで識別するのに役立ちます。 テキスト予測の説明(XEMPまたはSHAP)は、データセットにテキストが存在する場合、デフォルトで実行されます。
詳細については、テキスト予測の説明のドキュメントを参照してください。
NLPオートパイロットで言語サポートを強化¶
自然言語処理(NLP)に対して実施した多くの改善が一般提供されました。 その中で最も重要な改善点は、データ取込み時の言語検出にFastTextが適用されたことです。それにより、以下のことが実現しました。
-
DataRobotは、その言語用に最適化されたパラメーターで、適切なブループリントを生成できます。
-
検出された言語にトークン化を適応させることで、ワードクラウドと解釈性が向上します。
-
特定のブループリントトレーニングヒューリスティックをトリガーし、精度を最適化した高度なチューニング設定が適用されるようにします。
この機能は、多言語のユースケースでも有効です。オートパイロットは複数の言語を検出し、ブループリントの各種設定を調整して、最高の精度を実現します。
また、以下のNLPの機能強化も一般提供されました。
-
新しい事前学習済みBPEトークナイザー(任意の言語を処理できます)
-
NLPのためのKerasブループリントを改良し、精度とトレーニング時間を改善しました。
-
他のNLPブループリントでもさまざまな改善を行いました。
-
新しいKerasブループリント(BPEトークナイザー付き)をリポジトリに追加しました。
クイックオートパイロットモードの改善により、エクスペリメントが高速化¶
今月のリリースから、クイックオートパイロットモードでは、AutoMLプロジェクトにおいて、モデルの構築とリーダーボードへの入力が1段階のモデリングプロセスで行われるようになりました。 新バージョンのクイックオートパイロットでは、すべてのモデルが最大サンプルサイズ(通常は64%)でトレーニングされます。 クイックモデルの具体的な実行回数は、プロジェクトやターゲットのタイプによって異なります。 DataRobotは、ターゲットやパフォーマンス指標など、さまざまな基準で実行するモデルを選択しますが、その名前が示すように、迅速なエクスペリメントをサポートするために、トレーニング実行時間が比較的短いモデルのみを選択します。 実行時の効率を最大限に高めるために、特徴量を削減した特徴量セットの自動生成とフィッティングが行われなくなったことに注意してください。 (特徴量を削減した特徴量セットのフィッティングには、モデルの再トレーニングが必要です。)
アンサンブルモデルのデフォルト設定を変更¶
このリリースでは、アンサンブルモデルのデフォルトの動作に変更が加えられています。 アンサンブルモデルは、2つ以上のモデルの予測を組み合わせることで、精度を向上させる可能性があります。 DataRobotでは、高度なオプション上位モデルからアンサンブルを作成を有効にすると、オートパイロットの終了時に自動的にアンサンブルモデルを作成できます。 以前のデフォルト設定では、アンサンブルモデルが自動的に作成されました。現在、デフォルトではアンサンブルモデルは構築されません。
また、自動または手動でアンサンブルモデルを作成するときに使用できるモデルの数が変更されました。 当初は自動・手動ともにモデル数に制限はなく、その後、寄与するモデル数が3モデルまでに制限されましたが、この制限は1アンサンブルモデルにつき最大8モデルまでに変更されました。
今回、高度なアンサンブルモデルの自動作成が削除されました。 これらのアンサンブルモデルは逆段階的なプロセスを使用し、アンサンブルの交差検定スコアにメリットがある場合にはモデルを除外しました。
- Advanced Average (AVG) Blend
- Advanced Generalized Linear Model (GLM) Blend
- Advanced Elastic Net (ENET) Blend
以下のアンサンブルタイプは、使用非推奨になる予定です。
アンサンブル | 非推奨の状況 |
---|---|
Random Forest Blend (RF) | 既存のRFアンサンブルは引き続き動作しますが、新規作成はできません。 |
Light Gradient Boosting Machine Blend (LGBM) | 既存のLGBMアンサンブルは引き続き動作しますが、新規作成はできません。 |
TensorFlow Blend (TF) | 既存のTFアンサンブルは動作せず、新規作成もできません。 |
これらの変更は、お客様の声に応えて行われたものです。 アンサンブルは構築時間を長引かせ、デプロイの問題を引き起こす可能性があります。今回の変更により、この機能を必要とするユーザーだけがそうした影響を受けるようになりました。 テストの結果、ほとんどの場合、精度の向上は、オートパイロットでの実行時間の増加を正当化する理由にはならないことがわかりました。 また、アンサンブル機能を必要とするデータサイエンティストの場合、手動でのアンサンブルは影響を受けません。
日本語のコンプライアンスドキュメント作成機能を一般提供し、内容を充実化¶
このリリースから、日本語でのモデルコンプライアンスドキュメントの作成が一般提供機能になりました。 モデルごとに、効果的なモデルリスク管理に関する包括的なガイダンスとなる文書を日本語で作成し、編集可能なMicrosoft Word文書としてダウンロードすることができます。 プレビュー版では、未翻訳のためにレポートから削除されたセクションがありました。 今回、以下のセクションが翻訳され、二値分類および多クラスプロジェクトで利用できるようになりました。
- バイアスと公平性
- リフトチャート
- 精度
異常検知のコンプライアンス情報はまだ翻訳されていないため、含まれていません。 この情報が必要な場合は、英語版で入手できます。 コンプライアンスレポートはプレミアム機能です。利用可能かどうかについては、DataRobotの担当者にお問い合わせください。
ROC曲線の機能強化によるモデル解釈の支援¶
このリリースでは、ROC曲線タブが改善され、確率スケール上のどのポイントにおいても、モデルパフォーマンスの理解を深めることができます。 視覚化を用いると、次のことがわかります。
- 行と列の合計が、混同行列に表示されます。
- 指標セクションに最大6つの精度指標が表示されるようになりました。
- 表示しきい値 > 予測しきい値を表示を使用して、視覚化コンポーネント(グラフおよびチャート)をモデルのデフォルトの予測しきい値にリセットできます。
リーダーボード上のモデルからAIアプリを作成¶
リーダーボードでトレーニングされたモデルから直接AIアプリを作成できるようになりました。 そのためには、モデルを選択して、新しいアプリを構築タブをクリックし、ユースケースに最も適したテンプレートを選択します。
次に、アプリケーションに名前を付け、アクセスタイプを選択し、作成をクリックします。
新しいアプリは、リーダーボードモデルのアプリを構築タブと、アプリケーションタブに表示されます。
詳細については、AIアプリのドキュメントを参照してください。
AIアプリにカスタムロゴを追加¶
一般提供機能になりました。AIアプリにカスタムロゴを追加できます。これにより、自社のブランドロゴをAIアプリに入れてから、社外・社内で共有することができます。
新しいロゴをアップロードするには、編集したいアプリケーションを開き、構築をクリックします。 設定 > 構成設定で、参照をクリックして新しい画像を選択するか、新しいロゴフィールドに画像をドラッグアンドドロップします。
詳細については、AIアプリのドキュメントを参照してください。
AIアプリのヘッダーを改善¶
このリリースでは、AIアプリのレイアウトとヘッダーを改善しました。 以下のタブを切り替えると、アプリケーションの使用および編集時のUIに加えられた改善点を確認できます。
要素 | 説明 | |
---|---|---|
1 | ページパネル | アプリケーションページの名前変更、並び替え、追加、非表示、削除が可能です。 |
2 | ウィジェットパネル | アプリケーションにウィジェットを追加することができます。 |
3 | 設定 | 一般的な設定と権限を変更し、アプリの使用状況を表示します。 |
4 | ドキュメンテーション | DataRobotのAIアプリケーションに関するドキュメントを開きます。 |
5 | 編集ページのドロップダウン | 現在編集中のアプリケーションページを制御します。 別のページを表示するには、ドロップダウンをクリックして、編集したいページを選択します。 ページを管理をクリックすると、ページパネルが表示されます。 |
6 | プレビュー | さまざまなデバイスでアプリケーションをプレビューします。 |
7 | アプリに移動 / 公開 | エンドユーザーアプリケーションを開き、新しい予測をしたり、予測結果やウィジェットの視覚化を表示したりできます。 アプリケーションの編集後、このボタンに公開と表示されるので、これをクリックして変更を適用する必要があります。 |
8 | ウィジェット操作 | ウィジェットの移動、非表示、編集、削除を行います。 |
ウィジェット | 説明 | |
---|---|---|
1 | アプリケーション名 | アプリケーション名を表示します。 クリックすると、アプリのホームページに戻ります。 |
2 | ページ | アプリケーションのページを移動します。 |
3 | 構築 | アプリケーションを編集できます。 |
4 | 共有 | DataRobot内のユーザー、グループ、または組織とアプリケーションを共有します。 |
5 | 新しい行を追加 | 予測の作成ページが開き、単一レコードの予測を行うことができます。 |
6 | データを追加 | AIカタログまたはローカルファイルからバッチ予測をアップロードします。 |
7 | すべての行 | 予測の履歴を表示します。 行を選択すると、そのエントリーの予測結果が表示されます。 |
AIアプリでの多クラスのサポート¶
AIアプリは、多クラス分類のデプロイを3つのテンプレートタイプ(予測実行、最適化、What-If)すべてでサポートするようになりました。 これにより、より広範なビジネス上の問題を解決するアプリケーションを作成することができます。
AIアプリケーションのUI/UXを改善¶
このリリースでは、AIアプリケーションに以下の改善を行いました。
-
最適化アプリケーションの設定に役立つアプリ内ツアーが追加されました。 右上の「?」をクリックし、最適化ガイドを表示を選択します。
-
アプリケーションを開く際、構築モードではなく、利用モードで開くようになりました。
-
利用 > 最適化の詳細において、「What-Ifと最適化」ウィジェットがページ上部に移動しました。
-
これまで、最適化アプリケーションで最適化の計算を行うには、予測行を選択する必要がありました。 [すべての行]ウィジェットの行の最適化ボタンをクリックすれば、ページを離れることなく、最適化された予測値を計算して表示できるようになりました。
-
構築モードでは、ウィジェットに例を表示しないようにしました。
時系列のWhat-if AIアプリの作成¶
一般提供機能になりました。時系列プロジェクトからWhat-ifシナリオのAIアプリを作成できます。これにより、強化された視覚的およびインタラクティブなインターフェイスでアプリケーションを起動して簡単に設定を行えます。 さらに、What-ifシナリオアプリをコンシューマーと共有することで、コンシューマーはビルダーで生成済みのものから簡単に構築したり、同じ予測ファイルで独自のシナリオを作成したりすることができます。
さらに、シナリオ管理機能を使えば、事前に既知の特徴量を複数のシナリオで一度に編集することができます。
詳細については、時系列アプリケーションのドキュメントを参照してください。
[ユースケース]タブを[バリュートラッカー]に名称変更¶
このリリースから、DataRobotの上部にあるユースケースタブがバリュートラッカーに名称変更されました。 機能に変更はありませんが、この機能における「ユースケース」はすべて「バリュートラッカー」に置き換えられています。
詳しくは、バリュートラッカーのドキュメントをご覧ください。
スケジュールされたモデリングジョブの並べ替え¶
プロジェクトのワーカーキューでスケジュールされたモデリングジョブと予測ジョブの順番を変更できるようになり、より重要なジョブをより早く実行できるようになりました。
詳しくはワーカーキューのドキュメントをご覧ください。
プレビュー¶
多クラスプロジェクトでの予測の説明¶
DataRobotは、XEMPベースの多クラス分類プロジェクトにおいて、リーダーボードとデプロイの両方から各クラスの説明を計算するようになりました。 多クラスでは、計算するクラスの数を設定できます。また、予測結果や実際の結果からモードを選択したり(トレーニングデータを使用する場合)、特定のクラスのセットのみを表示するように指定したりすることもできます。
この機能は、複数の選択肢を検討する「ヒューマンインザループ」が必要なプロジェクトで特に役立ちます。 これまでの比較では、二値分類モデルを複数構築し、スクリプトで評価する必要がありました。 多クラスプロジェクトを構築する際、予測の説明は、モデルの精度が高すぎる場合(リーケージの可能性)、残差が大きすぎる場合(一部のデータが欠損している可能性)、モデルが2つのクラスを明確に区別できない場合(一部のデータが欠損している可能性)などを明らかにすることで、モデルの改善に役立てることができます。
詳細については、多クラスでのXEMP予測の説明のセクションを参照してください。
Text AIのパラメーターをComposable MLで提供¶
特定のText AI前処理タスク(レンマ化、品詞タグ付け、ステミング)を変更する機能が、[高度なチューニング]タブからComposable MLでアクセス可能なブループリントタスクに移動しました。 Text AIの新しい前処理タスクは、独自のテキストブループリントを作成するための新たな経路を提供します。 たとえば、TF-IDFブループリントに限定されることなく、その前処理タスクをサポートするあらゆるテキストモデルで見出し語認定を使用できるようになりました。
必要な機能フラグ:Text AIで構成可能なステップを有効にする
クラスターモデルでの予測の説明¶
今回プレビュー機能として提供されるクラスタリングでの予測説明を使用すると、特定の行のクラスター割り当てに最も貢献した要因が明らかになります。 このインサイトによって、クラスタリングモデルの結果をステークホルダーにわかりやすく説明できます。また、影響の大きい要因が特定されるため、事業戦略に注力できます。
多クラス予測の説明とよく似た機能ですが、クラスではなくクラスターについてレポートします。この機能を有効にすると、クラスターの説明は、リーダーボードとデプロイの両方から入手できます。 この機能は、XEMPベースのすべてのクラスタリングプロジェクトで利用可能ですが、時系列では利用できません。
必要な機能フラグ:クラスタリング予測の説明を有効にする
プレビュー機能のドキュメントをご覧ください。
Composable MLのタスクカテゴリーを改善¶
このリリースでは、Composable MLとブループリント編集の広範な導入とお客様のご意見をもとに、タスクの分類に改善を加えました。 たとえば、ブースティングタスクが、特定のプロジェクト/モデルタイプで使用できるようになりました。
ブループリントのトグルで、リーダーボードから概要と詳細の表示が可能¶
リーダーボードのブループリントタブから表示されるブループリントは、デフォルトでは読み取り専用の要約ビューであり、最終モデルで使用されたタスクのみが表示されます。
しかし、元のモデリングアルゴリズムにはさらに多くの「ブランチ」が含まれていることが多く、DataRobotは、プロジェクトデータや特徴量セットに適用できないブランチを削除しています。 読み取り専用モードで、トグルによって詳細ビューを表示できるようになりました。 この機能が導入される前は、ブループリント全体を表示するには、ブループリントエディターの編集モードに入る必要がありました。
必要な機能フラグ:ブループリントの詳細ビューの切り替えを有効にする
プレビュー機能のドキュメントをご覧ください。
スライスされたインサイトでモデルデータの部分母集団を表示¶
プレビュー版の機能です。スライスを使用すると、カテゴリー、数値、または両方の特徴量型のフィルターを定義できます。 プロジェクトのデータのセグメントに基づいてインサイトを表示および比較すると、モデルがさまざまな部分母集団でどのように動作するかを理解することができます。 スライスを「グローバル」スライス(すべてのトレーニングデータ)と比較することもできます(インサイトによります)。 スライスを設定することで、特徴量を選択し、演算子や値を設定して、返されるデータを絞り込むことができます。
リフトチャート、ROC曲線、残差、特徴量のインパクトの可視化では、スライスされたインサイトを利用できます。
必要な機能フラグ:スライスされたインサイトを有効にする
プレビュー機能のドキュメントをご覧ください。
時系列の予測実行アプリケーションに詳細ページを追加¶
時系列の予測実行AIアプリでは、特定の予測や日付に絞って予測情報を表示できるようになり、予測値を見るだけでなく、同じ日付に行われた他の予測との比較も可能になりました。 これまでは、予測値、残差、実測値と、上位3つの予測の説明のみ表示可能でした。
予測の詳細を見るには、予測値対実測値または予測の説明チャートで予測をクリックします。 これにより、予測の詳細ページが開き、以下の情報が表示されます。
説明 | |
---|---|
1 | 予測ウィンドウ内の平均予測値 |
2 | 各予測に対して最大10個の予測説明 |
3 | 予測ウィンドウ内の予測距離ごとのセグメント分析 |
4 | セグメント分析に含まれる、予測距離ごとの予測の説明 |
必要な機能フラグ:アプリケーションビルダーの時系列予測の詳細ページを有効にする
プレビュー機能のドキュメントをご覧ください。
サポート終了のお知らせ¶
Auto-Tuned Word N-gram Text Modelerのブループリントをリーダーボードから削除¶
二値分類、連続値、多クラス/マルチモーダルの各プロジェクトでは、Auto-Tuned Word N-gram Text Modelerのブループリントがオートパイロットの一部として実行されなくなりました。 ただし、このモデラーのブループリントは、引き続きリポジトリから入手可能です。 現在、Light GBM (LGBM) モデルは、これらの自動チューニングされたテキストモデラーをテキスト列ごとに実行し、それぞれについて、新しいブループリントがリーダーボードに追加されます。 しかし、これらのAuto-Tuned Word N-gram Text Modelerは元のLGBMモデルと相関しません(つまり、これらを修正しても元のLGBMモデルには影響がありません)。 オートパイロットは、テキスト列ごとに1つではなく、すべてのAuto-Tuned Word N-gram Text Modelerタスクに対して1つの大きなブループリントを作成するようになりました。 なお、この変更に下位互換性の問題はなく、新しいプロジェクトにのみ適用されます。
DataRobot Primeモデルの作成を削除¶
DataRobot Primeモデルを新規作成する機能が、アプリケーションから削除されました。 これは既存のPrimeモデルやデプロイには影響しません。 スコアリングコード機能を使用してRulefitモデルからPythonまたはJavaコードをエクスポートする新しい機能に置き換えられます。 Rulefitモデルは、親モデルからの予測ではなく元のデータを予測ターゲットに使用する点のみがPrimeと異なり、Java/Pythonのソースコードのエクスポートをサポートしています。 他のタイプのブループリントではJavaスコアリングコードの利用について変更はなく、既存のPrimeモデルは引き続き機能します。
USER/オープンソースモデルを11月に無効化¶
2022年11月をもって、DataRobotはUSER/オープンソース(「ユーザー」)タスクを含むすべてのモデルを無効にしました。 このモデルに該当するかどうかを確認する方法については、リリースのお知らせをご覧ください。 カスタムモデルを作成するには、Composable ML機能を使用します。