Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

夢の野球チームの予測

GitHubでこのAIアクセラレーターにアクセス

このアクセラレーターでは、DataRobot APIを活用して、連携して機能する複数のモデルをすばやく構築し、来シーズンの各選手の一般的なファンタジーベースボールの指標を予測します。 何千万人もの人が毎年ファンタジーベースボールをプレイ ファンタジースポーツゲーム協会によると、米国とカナダでは2022年に毎年1500万人以上がファンタジーベースボールをプレイしています。 これは米国とカナダで、アメリカンフットボールの次の、2番目に人気のあるファンタジースポーツで、ほとんどのファンタジースポーツと同様に、ファンタジーチームマネージャーは、通常、古典的なドラフトや競売スタイルの手順でチームに選手を選択します。 好きな選手から野球選手のチームを選択するか、平均に対する連続値を考慮せずに昨年の成績に基づいてチームを選択すると、毎年のように比較的弱いチームになる可能性があります。 野球は、統計の観点から、すべてのスポーツの中で最も適切に文書化されているものの1つであり、豊富なデータがあれば機械学習を使用して各選手の本当の才能レベルと翌年の予想される成績について、より良い推定を導き出すことができます。 これにより、より適切なドラフトが可能になり、"キャリア"の時期から外れた選手への過剰な支払いを回避し、ドラフトの後半のラウンドで(またはより少ない競売額で)高品質チームを効果的に充足できる過小評価された選手を特定できます。

ファンタジーベースボールで選手のドラフトをする際、これまでのキャリアにおける選手の成績に加えて、年齢、守備位置の変更、チームの変更などの効果に基づいて決定を行う必要があります。DataRobotを活用して、前年の成績に基づいて翌年の選手の成績のより良い予測を作成し、過去での同様の選手から学習できるパターンから学習します。

学習目標

  • FangraphsのAPIからMLB選手の統計の豊富なデータセットをクエリーする方法。
  • 自動時間認識特徴量エンジニアリング(自動特徴量探索)を使用してプロジェクトを設定する方法。
  • 新しいプロジェクトを構築せずに再予測するために、特徴量探索プロジェクト(セカンダリーデータ)のプレーヤーデータを更新する方法。
  • プロジェクト作成機能を繰り返して、多くのDataRobotプロジェクトを自動的に構築する方法。この場合、打率の平均(AVG)、ホームラン(HR)、得点(R)、勝利打点(RBI)、盗塁(SB)の5つの一般的なベースボール統計のそれぞれに1つのプロジェクト/モデルを構築できますが、投球統計でも同じプロセスを繰り返すことができます。

野球データを取得

このノートブックは、Pythonのpybaseballモジュールを使用して、2012年から2023年までの選手のシーズンからデータを取得します。このワークフローでは、機械学習アルゴリズムはコロナ禍以前の時代のデータに加えて2020年と2021年のデータからパターンを学習します。このデータは、トップモデルが2020年の短縮シーズンの問題をどのように回避するかについてどれだけうまく学習できるかを示すのに役立つはずです。

Fangraphsからは、打率の平均(AVG)やホームランの数(HR)などの最も表面的な統計から、予想される加重オンベース平均(xWOBA)やバレル接触率(バレル%)などの最も詳細な統計まで、毎シーズンヒットに関する300以上の特徴量を得ることができます。 DataRobotを使用して、これらの特徴量の多くを調べて、将来の成績を最もよく示す特徴量を見つけます。


更新しました February 20, 2024
Back to top