2.真に一律な基準とは?基準タイムの決定
前回はスピード指数の弱点に気づき、改良の必要性があることを述べました。
今回からは改良のポイントについて説明します。
『AP指数』とは?シリーズ一覧
サンプルの層別条件を検討する
スピード指数では、基準タイムというモノサシにより走破タイムを測り、指数化をしています。
この方法は競馬に限らず、何かの基準を決めて物事を比較評価、判断することはごく一般的に行われていますので、これ自体に問題があるわけではありません。
ここで重要なのは、モノサシの精度、つまり基準タイムの精度が比較結果の良し悪しに大きく関連してくることです。
前項で検証したようにスピード指数式の基準タイム算出方法には問題があると考えていますので、基準の決め方をまずは見直す必要があります。
見直すにあたり、基準を決めるためのサンプル抽出条件を決めていきます。この条件は、絞り込むことでサンプルのレベルが一定になると推定されるものを上げています。
①クラス…一定であろうレベルの馬にクラス分けされていると仮定
②馬場状態…馬によっては得手不得手があると仮定
③開催…季節により馬場の手入れの仕方が変わるので開催別に傾向が出ると仮定
例をあげて検証していきます。サンプルは以下の条件になります。
期間 | 2013.1~2018.5 |
コース | 中山ダ1800m |
クラス | 古馬500万下 |
サンプル数 | 99レース |
①クラス別
古馬500万下を3歳上500万下と4歳上500万下で分けて平均タイムを集計してみます。
クラス | 総数 | 平均タイム |
3歳上500万下 | 32 | 1:54.3 |
4歳上500万下 | 67 | 1:55.2 |
全体 | 99 | 1:54.9 |
クラス違いで0.9秒の差があることが分かります。2つのクラスの違いは3歳馬が出走可否と、上のクラスの1000万下からの降級馬の有無です。
毎年6月くらいにクラス再編成され、4歳上500万下クラスのメンバーに3歳馬と1000万下からの降級馬が出走できるようになります。活きのいい3歳馬と1クラス上で戦ってきた能力上位の降級馬が全体時計を押し上げている要因だと推定しています。
出走メンバーのレベルが変動していると考えられるため、時期によっても平均タイムは影響している可能性があります。
②馬場状態
言うまでもありませんが、馬場状態により時計の出方は変わります。現状は4段階に馬場状態は分けられていますが、最もサンプル数の多い良馬場のレースのものを使っていくことにしました。
今回の検証に使っているデータも良馬場にフィルタしてあります。
③開催別
時期による違いを何で層別するかを考えてみました。一番手っ取り早いのは月別ですが、12分割されるので、サンプル数が取れない可能性があります。そこで開催回に着目して層別してみることにしました。
開催 | 総数 | 平均タイム |
1 | 28 | 1:55.3 |
2 | 14 | 1:55.3 |
3 | 25 | 1:55.1 |
4 | 18 | 1:54.0 |
5 | 14 | 1:54.6 |
4歳上500万下クラスは第1回~第3回、3歳上500万下クラスは第4回と第5回にあたります。
6月のクラス編成以降、能力のある3歳馬と降級馬はどんどん勝ち上がっていくので、開催が進むごとにクラス全体のレベルは緩やかに低下していくはずです。
この仮説に基づくと、中山開催の中で最も3歳馬と降級馬が多いのは第4回開催で、平均タイムも最も速くなるといえるはずです。
第5回開催ではクラス全体のメンバーレベルが第4回ほどではないので、平均タイムも0.6秒低下していることが分かります。
仮説の裏付けになるデータが取れました。こういう数字が出ると思わずニヤリとしてしまいます。
サンプル数が取れるかという問題はありますが、開催別に基準タイムを決めることとしました。
平均タイムが基準でいいの?
開催別に基準タイムを決めることにしましたが、開催別の平均タイムをそのまま基準タイムにできるでしょうか?
開催 | 総数 | 平均タイム |
1 | 28 | 1:55.3 |
2 | 14 | 1:55.3 |
3 | 25 | 1:55.1 |
4 | 18 | 1:54.0 |
5 | 14 | 1:54.6 |
ここでポイントは、
次走以降の好走率がそろった基準であること
指数を扱う上でとても重要なことなので、初めて使う処理を施してみました。
指数化の目的は、基準タイムをもとに指数化をして、各馬を比較し、より高い指数を出している馬が好走率が高くなり、馬券になることです。
つまり、同じ指数ならば同じ好走率であることが求められるのです。
では、前回同様に基準タイムより速く走った馬の次走、同じクラスであった場合の戦績を見てみます。
開催 | 着度数 | 勝率 | 連対率 | 複勝率 |
1 | 2-4-4-9 | 11% | 32% | 53% |
2 | 3-3-1-6 | 23% | 46% | 54% |
3 | 3-2-1-9 | 20% | 33% | 40% |
4 | 1-3-2-4 | 10% | 40% | 60% |
5 | 0-0-0-6 | 0% | 0% | 0% |
第5回開催を除いて複勝率で見てみると、20%開きがあります。
ここで開発しようとしている指数の複勝率目標を例えば50%に設定したとします。第3回開催の複勝率を基準タイムを変動させて調整してみましょう。
タイム修正値 | 着度数 | 勝率 | 連対率 | 複勝率 |
0 | 3-2-1-9 | 20% | 33% | 40% |
-0.1秒 | 3-2-1-9 | 20% | 33% | 40% |
-0.3秒 | 3-2-1-9 | 20% | 33% | 40% |
-0.5秒 | 3-2-0-5 | 30% | 50% | 50% |
-0.5秒まで着度数がまったく動きませんでした。1:55.1から-0.5秒なので、1:54.6で50%に到達しました。
目標的中率を決め、このタイム調整の作業をひたすらコース別かつクラス別、開催別に行います。
ある程度のところまでは自動計算で近づけますが、最後は手作業です。地道な作業になりますが、基準タイムは指数の核となる基準タイム表が完成しました。
クラス間比較のための基準が必要
次に着目したのが、
スピード指数= (基準タイム-走破タイム)×距離指数+馬場指数+(斤量-55)×2+80
スピード指数計算式の80という数値。
従来のスピード指数では基準タイムがコースで1つだったので、走破タイムとの差がクラス差も含んでいました。
しかし、基準タイムがクラスごとに異なるAP指数の場合、走破タイムとの差はあくまでもそのクラスにおけるタイム差で、異なるクラスの比較ができなくなってしまいました。
それを解決するために着目したのが、この80という数値です。これをクラスごとに細かく変えることによりクラス間の差を表現します。その手順は次のようになります。
①根幹条件の基準指数の決定
まず、基準となるクラス条件(根幹条件)を決め、基準指数を決定します。
この例の場合、京都4歳上500万下 ダ1800mを根幹条件と定め、基準指数60と設定します。(このときの基準指数は、どんな数値でも構いません。)
②同条件の別コースの基準指数の決定
同条件の各コースの次走期待値から基準指数を補正し、各コースの基準指数を決定。
阪神4歳上500万下は京都の次走期待値よりも低く出ているため、補正-2を入れて基準指数58と設定。
③すべてのコース、クラス別の基準指数の決定
各コース、クラスの基準タイム差と次走期待値を比較し、基準指数を算出。
この例では1000万下の次走期待値が500万下とそろっていたため、基準タイム差0.7秒から基準指数を算出。
これで各コース、各クラス条件の基準指数が決定しました。
つまり、AP指数の算出式は次のように示すことができます。
AP指数= (基準タイム-走破タイム+馬場補正)×距離係数+不利補正+基準指数
当然ながらこの基準指数は次走期待値がそろえられています。AP指数の根幹にある考え方を基準指数は表現しているのです。
ようやくAP指数の骨格ができあがってきました。
次回からは、この骨格に肉付けをする、補正について紹介していきます。
『AP指数』とは?シリーズ一覧
お読みいただき、ありがとうございました。
クリックして応援いただけると励みになります!