各競馬AI・指数のお名前、これからは実名表記で…
これまで競馬AI・指数のお名前を仮名表記にしていたのですが、これからは実名表記にしようと思います…
理由は
- 実名表記にしても問題が起こらなそう
- 実名の方が、対象の開発者様にリポスト等で触れて頂きやすい
- 実名を知るための障壁によって、離脱するユーザーの方が少なくない
要するに、仮名表記は失敗でしたorz
トライアンドエラーの一環だったという事で…
まだカテゴリー名など実名表記に直してないのですが、徐々に修正していきます。
今回の記事は競馬AI・カイさん(Twitter・WEBサイト)が配信する、予測勝率に関する内容です!
予測勝率の「標準偏差」に注目する
標準偏差とは、各馬の予測勝率が平均からそれぞれどのくらい離れてるか?
という事です!
例えば、こういう5頭立てのレースがあったとします↓
予測勝率の平均は単純に100%/5頭で20%です。
このレースの標準偏差は15.5%。
この水準は言わば「各馬の競走能力に大きな差がある」ことを示しています。
もう1つ別のレースを↓
予測勝率の平均は同じく20%、標準偏差は2.3%。
中央競馬でこの水準はそう見ないほど低いのですが、分かりやすさのためにこれで…
カタイステークスに比べて、拮抗記念は各馬の競走能力に差がない・混戦レースと見ることが出来ます。
つまり予測勝率の標準偏差とは、そのレースがどういう性質のものかを判断する材料になります。
期待値100%以上の馬を例に
私は普段カイさんの予測勝率を元に自前で各馬の期待値を計算し、その数値を使って馬券を買っています。
ここでは自前期待値と呼ぶ事にします。
カイさんの予測が大幅にアップデートされた2022年10月1日から、この記事を書いている2024年12月11日現在まで、自前期待値が100%以上の馬は以下の成績を記録しています。
期待値 | 件数 | 勝率 | 単回収率 | 複勝率 | 複回収率 |
100%以上 | 8,934 | 14.4% | 102.0% | 35.3% | 95.2% |
評価通り実戦の単勝回収率が100%を超えており、複勝回収率も高い水準が維持されています。
そして、この該当馬達を「予測勝率の標準偏差ごと」に区分けすると、面白い傾向が見えてきます。
標準偏差1%ごとに見る、回収率の変化
自前期待値100%以上の馬のみを対象とした、予測勝率の標準偏差別・単複回収率が下記です。
予測勝率・標準偏差別の単複成績
- 開発者・配信者名
- 競馬AI・カイさん
- 分析期間
- 2022年10月1日 ~ 2024年12月9日
- 予測の掲載がないレースは排除
標準偏差 | 件数 | 勝率 | 単回収率 | 複勝率 | 複回収率 |
6%未満 | 1,150 | 9.7% | 123.6% | 26.3% | 113.0% |
6%~ | 1,664 | 9.3% | 92.0% | 27.3% | 90.5% |
7%~ | 1,752 | 10.5% | 113.0% | 29.6% | 92.0% |
8%以上 | 4,368 | 19.2% | 95.6% | 43.1% | 93.6% |
標準偏差が低い=混戦レースほど、単複ともに回収率が高くなっているのが分かります。
続いて、6%未満のゾーンを少し掘り下げます。
上記は2022年10月1日~2024年12月9日までが対象期間ですが、これを以下3つの期間に切り分けます。
- 期間A:2022年10月1日~2023年5月
- 期間B:2023年8月~2024年6月14日
- 期間C:2024年6月15日~12月9日
期間Aはカイさんの予測が大幅アップデートされてから、2023年に休止されるまで。
期間Bは同年に復帰され、2024年にマイナーアップデートをアナウンスされるまで。
期間Cはマイナーアップデートのアナウンスから現在まで。
(※他券種の分析をする際も、上記3つの期間に分けて成績をチェックしてます。)
どうして期間を切り分けるかというと…
まずアップデートを跨いだ事で、傾向がどう変化するか注視しなくてはなりません。
加えて、組み立てた馬券戦略の長期的回収率が高くても「ある一定の短期間だけ極めて好調、他の期間は低調」というケースがよくあるためです。
となれば、当然未来の回収率においても不安視せざるを得なくなります。
さて、期間ごとの成績はどうか?
期間 | 件数 | 勝率 | 単回収率 | 複勝率 | 複回収率 |
A | 209 | 11.0% | 113.3% | 28.2% | 119.2% |
B | 574 | 9.4% | 115.8% | 25.1% | 111.6% |
C | 367 | 9.5% | 141.6% | 27.2% | 111.7% |
見事全期間でプラス回収率となっています。
単勝は期間Cの影響で回収率が押し上げられていますが、複勝は概ね一定の水準で推移。
つまり「同じ期待値100%以上の馬でも、予測勝率の標準偏差が低いレースほど単複回収率が高くなる」と言えそうなんですね。
なぜ回収率が大幅に変わるのか?
回収率の差は偶然か否か?
前述したカタイステークス・拮抗記念を例に、論理的背景を探ります。
近年、確率予測や期待値を算出する開発者の方が続々と増えているように見え、その影響を考えます。
例えばカタイステークス。
こんな感じで1番人気馬が過剰にオッズを吸い、予測勝率・期待値ともに高いB・Cのような馬が「投票締切直前」に存在している状況。
この状況を多くの開発者の方・馬券購入者が把握している…
つまり「高期待値と評価した馬が被る」というケースが増えたのは、想像に難くありません。
そして締切直前に特定の単勝馬券が多く買われ、期待値が大幅に下がってしまう。
前述した期待値100%以上の馬・予測勝率標準偏差ごとの成績をもう一度見ます。
標準偏差8%以上のレースでは、それ未満のレースに比べて勝率が2倍近くあるにも関わらず、回収率は100%を少し切る辺りで止まってしまう。
確率予測・期待値を算出する開発者の方が増えた影響で、標準偏差の大きいレースには
「高期待値馬が明白になりすぎる」
というリスクがここ数年潜むようになったと思えます。
混戦レースに活路!
では拮抗記念・予測勝率の標準偏差が低いレースはどうでしょう?
カタイステークスに比べ、開発者の方による各馬の評価が
「少しずつ違う」
という状況になりやすいと見ています。
別の競馬AIによる予測では、例えばこんな感じになったり↓
そして予測勝率の評価だけでなく、単複馬券も適正オッズから離れやすくなるはずです。
開発者の方にとって”混戦”であれば、一般的な馬券購入者にとっては尚更評価の難しいレースになると思います。
つまり予測勝率の標準偏差が低いレースは、「どの馬が高期待値か、人によって評価がバラつきやすくなる」わけです。
予測・指数開発者の方が増えた今でも、予測勝率の標準偏差に注目することで、高回収率維持の可能性が高くなると考えます。
前述した表をもう一度。
カイさんの予測で計算した高期待値馬、予測勝率の標準偏差が低いレースでしっかり高回収率を記録してくれています。
標準偏差が高いレースであっても、単回95.6%・複回93.6%は十分すぎるほど好感触な水準です。
連系馬券ではどうか?
そもそも単複馬券は売上が少なく、且つ狙われやすい券種であり、他券種に比べて不利と見ています。
そのため、連系馬券だとまた話が違って来ます。
実際にカタイステークスのようなレースでも私は積極的に連携馬券を購入しており、プラス回収率維持に繋がっています。
- カタイステークスのようなレース プラス回収率が維持出来て、且つ的中率が比較的高い
- 拮抗記念のようなレース 的中率が比較的低いものの、回収率の大幅なアップが期待出来る
こんなイメージです。
単複を狙うのであれば、予測勝率の標準偏差が低い・拮抗記念のようなレースが良いのではないかという所です!
超高精度なカイさんの予測、多角的に活用しましょう!
今回のような活用法も、もとになるカイさんの予測が非常に高精度であるがゆえに成立します。
予測勝率のバラつきが大きい=混戦レースだなと、額面通り素直に受け取る事が出来るわけです。
また、「期待値の計算」はユーザーによってバラバラになるかと思います。
しかし、予測勝率の標準偏差は誰が計算しても同じです。(※直前情報などを使って更新しない限り)
ですので、ユーザー同士で活用法を共有したり、ああだこうだと話し合うキッカケにもなるんじゃないかと。
多角的に活用して、馬券成績アップに直結させていきたいですね!