Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

予測の説明

予測の説明は、行ごとに予測を左右する要素を示します。予測の説明は、特徴量が予測に及ぼす影響の定量的指標を提供し、特定のモデルが特定の予測を行った理由を示します。モデルが特定の予測を行った理由を理解することで、その予測が理にかなっているかどうかを検証することができます。これは、人間のオペレーターがモデルの決定を評価する必要がある場合や、モデルビルダーがモデルが期待どおりに機能することを確認する必要がある場合に特に重要です。たとえば、「なぜモデルは94.2%の再入院の可能性を示すのか?」(その他の例を以下に示します。)

予測の説明にアクセスして有効化するには、リーダーボードでモデルを選択し、理解 >予測説明をクリックします。

DataRobotは予測説明の計算における2つの方法を提供します:SHAP(SHapley値)とXEMP(eXemplarベースのモデルの予測の説明)

備考

同じインサイトが生成されても、異なる結果が返される可能性がある場合の混乱を避けるには、プロジェクトを開始する前に高度なオプションでSHAPを有効にする必要があります。

SHAPベースまたはXEMPベースの選択

SHAPとXEMPの両方は、特定の行のターゲットにどの機能が強くまたは弱く影響するかを推定します。通常、同様の結果が得られます。以下のリストは、いくつかの違いを示しています。

  • 結果は同様の結果を伝えるかもしれませんが、は異なります(方法が異なるため)。

  • SHAP値にはシンプルな身体的説明があります。

  • SHAPのオープンソースアルゴリズムは、容易な監査パスを規制当局に提供します。XEMPは、十分にサポートされているDataRobot独自のアルゴリズムを使用します。

  • XEMPはすべてのモデルで機能します。SHAPは、線形モデル、Kerasディープラーニングモデル、木型モデル(ツリーアンサンブルなど)に対応しています。

  • XEMP値は、上位50列までの最大10個の値に対して計算されます。SHAPには、列または値の制限はありません。

  • 多くの場合、SHAPはXEMPよりも5〜20倍高速です。

  • SHAPは付加的であり、予測に貢献する上位N個の機能の量を簡単に確認できます。

  • すべてのブループリントがオートパイロットに含まれているので、XEMPでは結果の精度がわずかに高くなる可能性があります。(SHAPはすべての主要なブループリントをサポートするので、多くの場合、精度は同じです。)

備考

予測の説明は予測が作成された理由に関する数量的なインジケータを提供しますが、計算では予測が計算された方法は完全に説明されません。詳細については、係数と前処理情報係数タブから使用します。

予測の説明の使用と解釈に関する方法ごとの説明については、XEMPまたはSHAPのページを参照してください。

データを評価する際の一般的な質問は、「あるイベントで特定のデータポイントが高リスク(または低リスク)と見なされるのは何故か」です。

予測の説明のサンプルケース:

大規模製造会社のビジネスアナリストのケースを考えてみます。データサイエンスの経験が浅いビジネスアナリストですが、DataRobotを使用して、製造工場で発生する可能性のある製品不具合を予測する実績を挙げていました。上司が、これらの予測に基づいて不具合率を低下させる推奨案を尋ねてきました。このビジネスアナリストは、説明の高レベルの集計に基づいて製品不具合の主要な要因を特定するために、DataRobotを使用して予期される製品不具合の予測の説明を生成します。ビジネスアナリストのビジネスチームは、このレポートを使用して不具合の原因に対処することができます。

その他の一般的なユースケースと考えられる理由を以下に示します。

  • 取引において詐欺のリスクが高いことを示すインジケーターは何でしょうか。可能性としては、カード所有者が住んでいる地域以外での取引、「不自然」な時間の取引、額が多き過ぎる(少なすぎる)取引などが考えられます。

  • 自動車保険が高額になる理由は何でしょうか。申込者が30才以下の独身の男性で、酒気帯び運転などの交通違反を犯したであることが考えられます。自宅を所有している既婚の人の保険料は低くなる傾向があります。

SHAPは、特定の予測が平均と異なる予測において各特徴量の責任の割合を推定します。2つの特徴量(クレジットカードの数と雇用状況)のあるシンプルなモデルを構築する信用リスクの例を考えてみます。このモデルでは、10枚のクレジットカードを持つ無職の申込者の債務不履行の確率は50%であるのに対し、平均の債務不履行率は5%であると予測されています。SHAPは、各特徴量が50%の債務不履行リスク予測にどのように貢献したかを推定し、25%がカードの数に起因し、20%のリスクが顧客が無職であることに起因すると判断します。


更新しました February 22, 2022
Back to top