DataRobotでの強化学習¶
このアクセラレーターでは、Q学習アルゴリズムに基づく非常にシンプルなモデルを実装します。 このアクセラレーターは、ニューラルネットワークや高度な数学に関する深い理解を必要としない強化学習の基本的なフォームに加えて、そのようなモデルをDataRobotにデプロイする方法を提供しています。
この例では、エージェントがグリッド内を移動して、ゴールに到達することを学習するグリッドワールド問題を提示します。
アクセラレーターは以下の手順を実行します。
- 状態とアクションスペースを定義する
- 個々の状態/アクションの組み合わせに対して、期待される報酬を格納するQテーブルを作成する
- 学習アルゴリズムを実装してモデルをトレーニングする
- モデルを評価する
- DataRobot REST APIエンドポイントにモデルをデプロイする
更新しました July 10, 2024
このページは役に立ちましたか?
ありがとうございます。どのような点が役に立ちましたか?
より良いコンテンツを提供するには、どうすればよいでしょうか?
アンケートにご協力いただき、ありがとうございました。