舟猫.com タイトル画像

統計学を軸にボートレース予想と知識・データやツールをお届けする「舟猫.com」へようこそ!

【第9回】 スタートが揃うと──を深掘りする [ボートレース×統計学]

【第9回】 スタートが揃うと──を深掘りする [ボートレース×統計学]

前回は統計学の手法のひとつ、仮説検定を使って「ボートレースはスタートが揃うと1コースが強いのか?」を検証しました。

具体的には、スタートが一番早かった艇と遅かった艇との差が0.08秒以内のものを「スタートが揃った」と定義し、その1コース勝率と全体の1コース勝率を母比率の検定を使って検証することで、「違いがある」と判断しました。

初めての実践的な検定だったこともあり、記事はかなり長文になってしまいました。

それでも多くの方に読んでいただき、とても嬉しい気持ちです。

その続編となる今回は、「スタートが揃った」という状況でどのようなことが起こるのかを、いろいろな角度から検証してみます。

レース場ごとに「スタートの違い」があるのか?

まず、ある半年間の全体の1コースの勝率が55.50%に対し、スタートが揃ったときの1コースの勝率は63.35%と上昇した、というのが前回のお話でした。

そこで、ボートレース場ごとの特徴として、「スタートが揃いやすい場」と「揃いにくい場」がありそうかを検証します。

もしかすると、ボートレース場のコース形状や水質、あるいは「ナイターレースは大時計が見にくい」といった事情が本当なら、場ごとに違いがあっても不思議ではありません。

一方で、さまざまなボートレース場に多くのレーサーが出場し、組み合わせも多様である以上、「どこも同じだろう」という考え方もできます。

割合だけでは見えない「スタートの揃いやすさ」

ここでは「スタートが揃うか否かを判別する方法」は扱わず、ある半年間のデータからスタートが揃いやすい場や、逆に揃いにくい場が実際にあるのかを調べてみます。

下の表をご覧ください。

各ボートレース場ごとに、フライングや出遅れなどがないレースのうち、スタートが一番早いレーサーと一番遅いレーサーとの差が0.08秒以内だったレースを集計しました。

表の一番下の「全体」欄を見ると、約27,000のレースを対象に、その約3割で「スタートが揃う」という状況になっていることが分かりました。

そこには、この基準の値と各ボートレース場でスタートが揃った割合から算出した検定統計量も載せています。

割合を見ると30%台のボートレース場が多く、35%を超える確率でスタートが揃う場もみられます。

また、20%台で基準より低いボートレース場もあり、中には約16%しかスタートが揃わなかった場もあります。

この割合だけで見ると、場ごとに違いがあると判断する方もいるでしょう。

ですが、この分析をより正確に理解するために、検定統計量に注目してみましょう。

予想戦略に組み込む「場別のスタート傾向」

検定統計量は、過去にもお話しした通り、割合(比率)にレース数を考慮して算出した値であり、「その確率は、試行回数を考慮してどのような意味があるか」を示す指標といえます。

それでは実際に、グラフに配置した各検定統計量の位置関係を見てみましょう。

これらの数値の関係性を知ることで、割合だけでは分からないものが見えてきます。

割合で見ると最も大きかったボートレース平和島は、検定統計量で見ると次点のボートレース丸亀に抜かれ、順位が入れ替わっています。

これは先にお話しした通り、レース数が大きく影響しているとみられます。

また、先ほど触れた「ナイター開催の場はスタートが揃いにくいのかも」という疑問も、今回の結果を見る限り当てはまらないようです。

こうして検定統計量を比べると、「どの場でスタートが揃いやすいのか」がよりはっきり見えてきます。

上の表やグラフを見て、皆さんはどんなことを感じましたか。ぜひご意見を聞かせてください。

さらに点数を絞るため「コース着順の分析」

上の検証から、ボートレース場ごとにスタートの揃いやすさに違いがあることが明らかになりました。

もしこれを自身のボートレース予想に組み込むなら、場ごとに予想の立て方を変え、精度を研ぎ澄ますことで的中率の向上も期待できます。

舟券攻略の側面からいえば、スタートが揃うと予想できる場合、3連単なら120点から20点へと絞りやすくなるといえるでしょう。

とはいえ、まだ20点──。さらに点数を絞るため、次のことを検証します。

2着・3着に現れる意外な傾向

同じ半年間のスタートが揃ったレース(8,178レース)について、1コースが1着だったときの2着・3着がどのコースの艇だったのかを調べてみました。

本場などでボートレースを観戦していると、スタートが揃った瞬間に「これは内で決まりだな…」という声を耳にしたことがあります。

本当に内の艇で決まるのかも含めて、下の表で確認してみましょう。

この表は、1コースが1着だったレースの2着・3着がどのコースの艇だったかを、「全体」と「スタートが揃ったとき」に分けて表したものです。

さらに、全体の出現率と、スタートが揃ったときのレース数および出現率を考慮して算出した検定統計量も掲載しています。

出現率だけをみると、すべての項目で数値が上昇しており、やはりコースの内側から決着する傾向にあることが分かります。

内有利は本当か?外も狙えるその理由

そこで、その上昇具合を示す検定統計量の位置関係をグラフに示し、出現率だけで見たときの違いを確認します。

なお、コースは「c」と略記しています。

仮に3コースまでを「内」、4コースから6コースを「外」とすると、外のコースの艇が2着または3着に入るケースが多く見られることが分かります。

これはスタートが揃うことで、割合としては内側が有利であることに変わりはないものの、外の艇にも十分チャンスが増えている、と分析できます。

つまり、目の前のレースでスタートが揃いそうだと考えるなら、外側の艇も上手に絡めることで、根拠ある予想を組み立てるうえで欠かせない視点です。

この結果は、私自身も半信半疑だった「ボートレースはスタートで決まる」という考え方をデータで補強してくれるものになりました。

レーサーの言葉から感じるデータのリアル

上のふたつの検証から、ふと思い出したことがあります。

どこからの情報かは忘れてしまいましたが、あるボートレーサーが「丸亀の6コースがそう遠く感じないことがある」と発言しているのを見聞きしたことがあります。

これを深く読み解くと、私は「丸亀では、スタートが揃ったときの6コースはそれほど遠く感じない」と受け取りました。

今回分析したように、丸亀は特にスタートが揃いやすい傾向にある場です。つまり、レーサーは無意識のうちに、スタートが揃うことによって外側の艇にもチャンスがあるという事実を肌で感じ取っていたのかもしれません。

これはデータと体感が見事に一致した瞬間といえます。皆さんはどう考えますか──。

今回は「スタートが揃う」という観点から統計学でデータを分析し、さらに深掘りしました。

次回はボートレースに関する別のテーマを取り上げ、仮説検定を使った新たな分析に挑戦します。