Permutationの有用性によるロバストな特徴量の選択¶
機械学習モデルは少ないデータではバイアスがかかり、一部の業界(ヘルスケアや製造業など)ではラベル付きデータが不足しています。 これを考慮すると、ロバストな特徴量を選択してモデルを構築することが適切なアプローチです。 このアクセラレーターは、ロバストな特徴量を選択して、交差検定に複数のシードを使用し、ダミー特徴量を追加してPermutationの有用性の中央値を計算し、最もロバストなダミー特徴量を選択するアプローチを紹介します。
このノートブックでは、以下のことを行う方法がまとめられています。
- DataRobotに接続する。
- 複数のシードで複数のプロジェクトを作成し、ダミー特徴量を追加する。
- パフォーマンスが上位のモデルからアンサンブルを作成。
- パフォーマンスが最も高いアンサンブルモデルから、モデリングのPermutationの有用性を取得する。
- Permutationの有用性がダミー特徴量よりも低い特徴量を削除する。
更新しました August 26, 2024
このページは役に立ちましたか?
ありがとうございます。どのような点が役に立ちましたか?
より良いコンテンツを提供するには、どうすればよいでしょうか?
アンケートにご協力いただき、ありがとうございました。