あけましておめでとうございます。いつも企画を思いついては2週間で飽きることが常の筆者であるが、今回は本気である。
今年の目標は「単勝万馬券を獲る」ことである。
せっかく元日に思いついたので、一年間頑張っていこうと思う。
祈 万馬券
単勝万馬券とは、単勝100倍以上の勝ち馬の単勝馬券のことである。万馬券。憧れの言葉である。筆者がこの言葉を知ったのは幼稚園の頃、母の字で「祈 万馬券」と書かれたシールが貼ってあるのを見た時である。順調に育った僕は20歳で馬券を始め、3連単万馬券を二度獲った。また、天皇賞秋でエフフォーリアの単勝3000円を握りしめ、これも万馬券となった。
が、これは母がいう「万馬券」だろうか?まず、3000円握って万馬券はちゃんちゃらおかしい。一万円の複勝を握って一万一千円で万馬券とは言わない。やはり万馬券とは100円であるべきだ。
そういう意味で考えると、3連単万馬券もいただけない。一点買いではないからである。むろん、3連単一点買いなら漢だが、筆者はそうではなかった。
やはり単勝100円で1万円以上の払い戻しを受けたいものだ。だが、この願いには重大な問題点がある。それは、なかなか単勝万馬券は出ないということである。つまり、あるレースの馬柱を目の前にうんうん唸って考えて、チャッピーに考えさせて馬券を買っても、そもそも100倍の馬が勝たなければすべて無駄なのである。
たとえば、2025年の中央競馬では3455ものレースが施行されたが、単勝万馬券が出現したのはわずか23回である。任意のレースが単勝万馬券となる可能性は0.66%にすぎない。
さらに厄介なことに、3455のレースですべて穴馬を100円買えばよいというわけではない。3455のレースの中には、単勝100倍以上の馬が複数いるレースがたくさんある。
清貧を貫く自分にとって、単勝100倍台の馬をすべて買うことは現実的ではない。そこで、新年2026年1月2日、まだ中央競馬が開幕しないうちに、まずは短時間でできるデータ分析である程度買うレースの方針を定めておこうと考えた。細かい点や具体的な馬の検討はのちのちチューニングしていけばよいだろう。
まず、多忙な自分には中央競馬全レースを予想するのは難しい。レースの数を程度絞っておきたい。まずはクラス分けで勝負レースを絞ることにした。
クラスと単勝万馬券
2021年から2025年までの中央競馬全レースを対象に、クラスごとの施行回数、単勝万馬券の出現回数、その確率をまとめた表が以下の通りである。
最も確率が高いのは三勝クラスのレースである。1.41%で万馬券が出るなら、単勝回収率は100%を超えている。ハンデ戦などがある関係かなぁとは思うが、細かい理由はのちのち具体的なレース検討で明らかになるだろう。
次に高いのが未勝利戦。たぶん、芝で好成績の未勝利馬がダート替わりして1.4倍くらいの支持を集めて馬券外に吹き飛ぶみたいなケースが多いのかなと想像する。筆者は未勝利戦が好きである。特にダートの、400倍くらいの馬が無名の騎手を乗せて、直線で大きく離されてえっちらおっちら走っているのが好きである。
次に高いのは新馬戦だが、これは予想が難しい割に1%を割っているから、検討から外すこととする。
以上から、とりあえず未勝利戦と三勝クラスに絞ってやっていく。
距離と頭数
三勝クラスの検討は後回しにして、一旦大好きな未勝利戦に限定してやっていく。休日に早起きして、未勝利戦を見ながらコーヒーを飲むなんていいじゃないか。
過去10年で出現した単勝万馬券は292回で、そのうち107回(全体の36%)が未勝利戦である。
10年の全レース数が約34500回で未勝利戦は11100回(全体の32%)くらいなので、やはり施行回数の割に単勝万馬券が若干多い計算になる。
次は競馬場で絞ろうかなとちまちまデータを集めているうちに、重大な事実に気が付いた。競馬場によってフルゲート頭数が違うという事実である。
フルゲート頭数が16頭のコースの方が、フルゲート頭数が12頭のコースより単勝万馬券は出やすいに決まっている。出走頭数が多くなればオッズが上がりやすいからである。いくら単勝万馬券を探しているからといって、じゃあ出走頭数が多いレースを買えばいいですよというのはあまりに退屈すぎる。こっちが求めてるのは出走頭数に関係なく「荒れやすい」コースである。確かに、いかに荒れやすくても出走頭数が少なければ単勝万馬券は出ないが、それは実際に土曜の朝にnetkeibaでオッズを確認すればいい話であって、事前に絞るのは違う。
そもそも競馬場だと、一応福島競馬場が統計的に荒れやすいことは確認したが、じゃあ福島開催以外の日は指くわえてBS11眺めるのか?いや毎週買いたいよ(反語)という話になる。そこで、距離と出走頭数に着目することとした。
まず、芝とダートで分けた。障害競走は除いた。
次に、距離別に過去10年の施行回数と単勝万馬券出現数を出した。(時間がかかった)
これで単勝万馬券の出現確率を求めることができるが、これではフルゲート数を考慮できていない。そこで、各距離の過去100レースの出走頭数のデータを集め(時間がかかった)、出走頭数が多いほど値が低くなる指数を作った。(出走頭数が多ければ単勝万馬券は出やすいのだから、この点を割り引く必要があるため)これを距離指数とよぶ。指数が大きいほどその距離は荒れやすい。
距離指数の計算式
期待値(分母): 平均頭数 $n$ から組み合わせ数 $C = n(n-1)(n-2)$ を算出。全データにおける「1通りあたりの万馬券発生率(定数)」を求め、各距離の期待値を計算。
実績値(分子): 万馬券数 $\div$ 施行回数。
距離指数: 実績値/期待値。
距離別に出現確率や距離指数をまとめた表が以下の通り。
よいものを太字に、すごいものを青字にした。
距離指数の大きい順に並び変えてみる。
どうでだろうか。距離指数を導入した意味がほとんどなく、出現確率で充分だった。一応、ダート1000mが出現確率の割に荒れやすいことが分かったことが収穫か。
表の「施行回数」列で一目瞭然のように、施行回数が少ないレアなコースで万馬券が出やすいことが分かった。ほとんどの馬が距離変更になるので予想が難しいのだろうか。
上から芝2000までで、過去10年の万馬券出現数は43回。2026年も4回くらいはこの中から出るだろう。必見。
じゃあどの馬を買えばいいんだ、というのは別の話。明日から頑張る。

0 件のコメント:
コメントを投稿