作成ソフト『AlphaKeiba』とは
AlphaKeibaの評価にはJRA-VANが提供している過去10年以上のデータを用いています。
主な特徴量は以下の通りです。
コース
距離
芝/ダート
枠順
馬場状態
天気
馬体重
馬の出走回数
馬の過去の着順
馬の過去の走破タイム
馬の過去の上がり3Fのタイム
馬の脚質
他馬の脚質
騎手の平均着順
これらの中からレース条件(モデル)ごとに適切な特徴量を選別し、勝ち馬判定器の入力とします。 勝ち馬判定器には機械学習アルゴリズム「Random Forest」を使用しています。 Random Forestを例えるならば、注目するファクターの異なる何人もの予想家に勝ち馬を予想させて、 最後にその結果の多数決をとるというアルゴリズムになっています。 このように多数決をとる機械学習アルゴリズムを専門用語ではバギングと呼びます。 この予想家の役割をする部分にはDecision Treeという識別器を用いたのがRandom Forestです。 Random Forestにより得られた勝利確率とオッズから真の勝利確率を推定することで高い精度を誇る予想プログラムを実現しています。
■作成者コメント
我々は機械に与える特徴量と学習の方法を指定しているだけなので、何を根拠に予想しているのかはわかりません。
たまに自分のプログラムした結果を疑いたくなりますが、試しに買ってみると万馬券が当たったりして、完全に人間の思考を超えてしまっているように思えます。
■お茶女チーム「万馬券」
作成ソフト『競馬たん』とは
レースデータ、馬データ、成績データ等から特徴量を選び、こちらも機械学習手法を用いて独自の指数を算出しています。
予測するレースのデータを入力として与えると、指数の高い順に馬の名前が出力されます。
予想に使ってる要素数は約30個程。
独自の要素としては各馬の一着率や平均獲得賞金額などを算出し、予想に使用しています。
■作成者コメント
今後、選出レースの自動化やコース別のモデル化などを追加していきたいです!
※ソフトに機能追加や変更が有りましたら、追記させて頂きます。