• このエントリーをはてなブックマークに追加
AlphaKeibaのロジック解説
閉じる
閉じる

新しい記事を投稿しました。シェアして読者に伝えましょう

×

AlphaKeibaのロジック解説

2016-05-27 16:10
    AlphaKeibaの評価にはJRA-VANが提供している過去10年以上のデータを用いています。 主な特徴量は以下の通りです。
    • コース
    • 距離
    • 芝/ダート
    • 枠順
    • 馬場状態
    • 天気
    • 馬体重
    • 馬の出走回数
    • 馬の過去の着順
    • 馬の過去の走破タイム
    • 馬の過去の上がり3Fのタイム
    • 馬の脚質
    • 他馬の脚質
    • 騎手の平均着順
    これらの中からレース条件(モデル)ごとに適切な特徴量を選別し、勝ち馬判定器の入力とします。

    勝ち馬判定器には機械学習アルゴリズム『ランダムフォレスト』を使用しています。
    ランダムフォレストを例えると予想の観点が異なる予想家をたくさん集めて多数決を取るようなものです。
    ある予想家Aは距離、コース、枠順だけを見て予想し、別の予想家は上がりタイムと馬場状態と脚質だけを見て予想をします。
    各予想家がどの特徴量を見て予想するかという部分はランダムに決定します。
    そして最後に100人近くの予想家の結果の多数決をとり、勝利確率(連対確率)を推定します。

    機械学習ではこの1人の予想家の役割を担う部分を識別器と呼びます。
    ランダムフォレストではこの識別器に決定木(decision Tree)を用います。
    ランダムで選択した特徴量による予測をたくさんの決定木によっておこなうため、『ランダムフォレスト』と命名されているわけです。

    ランダムフォレストのようにたくさんの識別器の結果を組み合わせるような方法を『アンサンブル学習』と呼びます。

    アンサンブル学習にも色々種類があり、たくさんの識別器をどのように組み合わせるかの方法がいくつかありますが、ランダムフォレストのように多数決をとる方法では直感的にもわかるようにバラつきが小さくなり精度が高くなるわけです。

    実際の競馬ファンを一人ひとりを決定木にような識別器と考えるならば、その集合知であるオッズは予測をアンサンブルした結果であると言えます。
    オッズから計算される推定勝率(支持率)はそこまで悪い精度ではありませんが、やはり人間というブレの大きい識別器により算出された推定値には歪みがあります。

    すなわち機械学習により人間の集合知を越えることができれば、より正確な推定勝率からオッズの歪みを検出し、回収率100%を越えることが夢ではなく現実的に可能となります。

    『AlphaKeibaの穴馬マイニング』ではそれが実際に可能であるということを証明するために予測を公開していきます。

    ロジックの詳細情報をさらに知りたい方は以下のページからスライドをご覧ください。

    AlphaKeibaはなぜ30万を獲得できたのか』 (http://www.slideshare.net/data_sciesotist/alphakeiba30)



    チャンネル会員ならもっと楽しめる!
    • 会員限定の新着記事が読み放題!※1
    • 動画や生放送などの追加コンテンツが見放題!※2
      • ※1、入会月以降の記事が対象になります。
      • ※2、チャンネルによって、見放題になるコンテンツは異なります。
    ブログイメージ
    AlphaKeibaの穴馬マイニング
    更新頻度: 毎週土,日,月曜日
    最終更新日:
    チャンネル月額: ¥1,080 (税込)

    チャンネルに入会して購読

    コメントを書く
    コメントをするには、
    ログインして下さい。