競馬AI開発

馬券的中確率の算出方法

馬券を期待値を用いて購入する場合、
期待値 = (事前)オッズ × 該当馬券の(予測)的中確率
であるため、「的中確率」を高精度に算出する必要があります。
以下に、各馬券種の的中確率を算出するための計算式等を整理します。

前提条件

 特定のレースについて出走馬がn頭(馬番号1からn)がいるとき、

$$P_1{(A)} , P_2{(A)} , P_3{(A)}$$

をそれぞれ馬番Aが1着、2着、3着になる確率を表すものとする。

 ただし、
 $$\sum_{i=1}^{n}{P_1{(i)}}=1 , \sum_{i=1}^{n}{P_2{(i)}}=1 , \sum_{i=1}^{n}{P_3{(i)}}=1$$

 を満たす。(つまりそれぞれ出走馬内での確率和が1になる)

各馬券種の的中確率

「単勝」「複勝」「馬単」「馬連」「枠連」「ワイド」「三連単」「三連複」の的中確率の算出式をまとめる。
なお、2頭以上が的中に絡む馬券の的中確率はHarvilleにより提唱されたハーヴィルの公式(1973)の考えがベースとなっている。

1. 馬番Aの「単勝」的中確率

馬番Aが1着になる確率と等しいので、    

$$P_1{(A)}$$

2.馬番Aの「複勝」的中確率

まず、 Aが1着にならず2着になる確率Q(A)は、
・A以外の出走馬が1着になる
かつ
・Aが2着になる
ときの確率和なので、
$$Q(A) =\sum_{i≠A}^{}{P_1{(i)}}×\frac {P_2{(A)}}{1 - P_2{(i)}}$$
で求める(この計算式は「馬単」の的中確率算出の考え方と同じ)。

次に、Aが1,2着にならず3着になる確率はR(A)は、
・A以外の出走馬が1,2着になる
かつ
・Aが3着になる
ときの確率和なので、
$$R(A) = \sum_{i≠A,j≠A}^{}{P_1(i) × }\frac {P_2(j)}{1 - P_2(i)}{×}\frac {P_3(A)}{1 - P_3(i) - P_3(j)}$$
で求める(この計算式は「三連単」の的中確率算出の考え方と同じ)。
よって、Aの複勝的中確率は
Aが1着,2着,3着になる確率の和
$$P(A) + Q(A) + R(A)$$
となる。
※ 単純に 
      $${P_1(A)}+{P_2(A)}+{P_3(A)}$$
 でないことに注意。

3.馬番A→馬番Bの「馬単」的中確率

・馬Aが1着になる
かつ 
・馬Bが2着になる
ときの確率を求めればよい。
これは、
「馬Aが1着になる確率」

「馬Aが1着になる(2着にならない)とき馬Bが2着になるときの条件付確率」
の積に等しいので、
$${P_1(A)}×{\frac{P_2(B)}{1 - P_2(A)}}$$

4. 馬番Aと馬番Bの「馬連」的中確率

「馬単」の的中確率算出式を利用して、
・馬番A→馬番Bの「馬単」
・馬番B→馬番Aの「馬単」
の確率を算出し、確率和を求める。

5. 枠番Xと枠番Yの「枠連」的中確率

X,Yに属する出走馬についてすべての馬番組み合わせの馬連確率を算出し、確率和を求めればよい。
例えば、
枠番1に「馬番1」、枠番2に「馬番2」が属するとき、
・馬番1と馬番2の「馬連」
を算出し、確率を求める(このとき、馬連と枠連の確率が等しくなる)。

また、
枠番7に「馬番13」「馬番14」「馬番15」
枠番8に「馬番16」「馬番17」「馬番18」
が属するとき、

<枠番7同士での決着パターン>
・馬番13と馬番14の「馬連」
・馬番13と馬番15の「馬連」
・馬番14と馬番15の「馬連」

<枠番8同士での決着パターン>
・馬番16と馬番17の「馬連」
・馬番16と馬番18の「馬連」
・馬番17と馬番18の「馬連」

<枠番7,8での決着パターン>
・馬番13と馬番16の「馬連」
・馬番13と馬番17の「馬連」
・馬番13と馬番18の「馬連」
・馬番14と馬番16の「馬連」
・馬番14と馬番17の「馬連」
・馬番14と馬番18の「馬連」
・馬番15と馬番16の「馬連」
・馬番15と馬番17の「馬連」
・馬番15と馬番18の「馬連」

を算出し、確率和を求める。

6. 馬番Aと馬番Bの「ワイド」的中確率

(1)馬番Aが1着 かつ 馬番Bが2着
(2)馬番Aが1着 かつ 馬番Bが3着
(3)馬番Aが2着 かつ 馬番Bが1着
(4)馬番Aが2着 かつ 馬番Bが3着
(5)馬番Aが3着 かつ 馬番Bが1着
(6)馬番Aが3着 かつ 馬番Bが2着
の確率を算出し、確率和を求めればよい。
(1)(3)は馬単確率算出と同義。
(2)は、
・馬Aが1着
かつ
・馬A,B以外が2着
かつ
・馬Bが3着
ときの確率和なので、
$$\sum_{i≠A,i≠B}^{}{P_1(A) × }\frac {P_2(i)}{1 - P_2(A)}{×}\frac {P_3(B)}{1 - P_3(A) - P_3(i)}$$
(4)は、
・馬A,B以外が1着
かつ
・馬Aが2着
かつ
・馬Bが3着
ときの確率和なので、
$$\sum_{i≠A,i≠B}^{}{P_1(i) × }\frac {P_2(A)}{1 - P_2(i)}{×}\frac {P_3(B)}{1 - P_3(i) - P_3(A)}$$
(5)は(2)の確率算出法と同義。
(6)は(4)の確率算出法と同義。

7.馬番A→馬番B→馬番Cの「三連単」的中確率

・馬Aが1着になる
かつ 
・馬Bが2着になる
かつ
・馬Cが3着になる
ときの確率を求めればよい。
これは、
「馬Aが1着になる確率」

「馬Aが1着になる(2着にならない)とき馬Bが2着になるときの条件付確率」

「馬Aが1着、馬Bが2着になる(馬A,Bは3着にならない)とき馬Cが3着になるときの条件付確率」
の積に等しいので、
$${P_1(A) × }\frac {P_2(B)}{1 - P_2(A)}{×}\frac {P_3(C)}{1 - P_3(A) - P_3(B)}$$

8. 馬番Aと馬番Bと馬番Cの「三連複」的中確率

7を利用して、
・馬番A→馬番B→馬番Cの「三連単」
・馬番A→馬番C→馬番Bの「三連単」
・馬番B→馬番A→馬番Cの「三連単」
・馬番B→馬番C→馬番Aの「三連単」
・馬番C→馬番A→馬番Bの「三連単」
・馬番C→馬番B→馬番Aの「三連単」
の確率を算出し、確率和を求める。

2着、3着になる確率について

上記の各馬券種の確率算出には、「1着確率」「2着確率」「3着確率」が既知であることを前提としている。
「1着確率」には機械学習などで算出する場合が多いが、「2着確率」「3着確率」についてはどのように算出するか検討する必要がある。

(方法1)シンプルに2,3着になる確率も1着になる確率と同じとみなす。

つまり、
$$P_2{(A)} = P_1(A)$$
$$P_3{(A)} = P_1(A)$$

(方法2)直接算出する

機械学習を用いて目的変数を「2着か」「3着か」としてモデル構築を行う。
構築したモデルの予測値を「2着確率」「3着確率」として活用する。

(方法3)指数演算などで補正する

BillBenterの論文(*)の考えを参考
穴馬のような低確率では「2,3着が多くなり」、人気馬のような高確率では「2,3着が少ない」という傾向を数式で表現する。
具体的には、
$$P_2{(A)} =\frac {(P_1(A))^{γ}}{ \sum_{i=1}^{N}{(P_1(i))^{γ}}}$$
$$P_3{(A)} =\frac {(P_1(A))^{σ}}{ \sum_{i=1}^{N}{(P_1(i))^{σ}}}$$
で補正する。
なお、式中に出てくるγ,σは論文中でγ=0.81,σ=0.65と最尤推定法で求められた値であるが、一般的な値でない(データ依存)ため注意
詳細は原論文を読むことを推奨。
(*) "Computer Based Horse Race Handicapping and Wagering Systems: A Report",William Benter,1994

1着確率の精度について

前提として、馬券種に関わらず大きく計算結果に影響する1着確率の精度が重要となる。
1着確率の精度を測る一つの方法として「単勝オッズとの精度比較」が考えられる。
こちらのコラムにて記載しているように、単勝オッズを支持率に変換するとその精度は的中率として基本的に高いのでまずはオッズの精度に近づけることを目指したい。

※馬券的中確率の算出についてはAI競馬 人工知能は馬券を制することができるか?』にも記載されているので興味がある方はご覧ください。

 

-競馬AI開発

© 2023 AISS BLOG