Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

ハイパーパラメーター最適化ワークフロー

GitHubでこのAIアクセラレーターにアクセス

機械学習では、ハイパーパラメーターのチューニングは、機械学習のブループリントまたはパイプラインで"設定"(ハイパーパラメーター)を調整する行為です。 たとえば、調整可能なハイパーパラメーターは、XGBoostモデルの学習率、ニューラルネットワーク内のアクティブ化関数、またはカテゴリー特徴量のワンホットエンコーディングのグループ制限です。 これを行うための多くの方法が存在し、最も単純な方法は、考えられるパラメーター値の組み合わせを広範囲にわたって総当たりで検索することです。 ハイパーパラメーター値の個々の組み合わせではブループリントの再学習が必要になるため、人間の作業はほとんど必要ありませんが、機械学習では非常に時間がかかります。 そのために、担当技術者は、ハイパーパラメーターの最適な組み合わせを検索するより効率的な方法を見つけるよう努力しています。

このAIアクセラレーターは、オープンソースの最適化モジュールを活用して、DataRobotブループリントのパラメーターをさらにチューニングする方法を示しています。 HyperoptモジュールをAPIワークフローに統合して、ネイティブの DataRobotハイパーパラメーターチューニングを構築します。 Hyperoptモジュールは、Tree-structured Parzen Estimator(TPE)として知られるパラメーターチューニングへの特定のベイズアプローチを可能にしますが、より一般的には、このアクセラレーターは、DataRobotのAPIを活用してどのパラメーターチューニング最適化フレームワークとも連携する方法の例として見ることができます。

以下の内容を探ります。

  • DataRobotプロジェクトから特定のブループリントを特定し、APIを介してハイパーパラメーターを確認する。
  • hyperoptを使用して検索空間と最適化アルゴリズムを定義する
  • hyperoptのTree-structured Parzen Estimator(ベイジアン)手法を使用してハイパーパラメータを調整する

更新しました February 20, 2024