2023-11-04

「優勝確率」に意味はない

全国のスポーツ紙野球誌面担当記者よ、刮目せよ(そんな大した話ではない笑)

この時期のプロ野球日本シリーズ関連記事を見ると、優勝確率、と言う数字毎日踊るのである

11/3現在「【阪神日本シリーズで2勝2敗から王手のチームはV確率75%」

https://news.yahoo.co.jp/articles/4f54c052feb332637de4cbbda7fe1c7ac3dc8a80

ふむふむなるほど。(2勝2敗(引き分け含む)から王手をかけたケースは、過去28度。そのうち優勝21度のV確率75%。)

11/1「阪神追いつき29度目の2勝2敗、優勝確率は46%」

https://www.nikkansports.com/baseball/news/202311010001529.html

おお、前日には全く低かったんですね。

10/31オリックス確率は79% 1勝1敗から先に2勝目を挙げたチームが27度優勝」

https://www.nikkansports.com/baseball/news/202310310001318.html

ホウホウ、この時点ではオリックス日本一になりそうだ、という話だったね、そういえば。

10/28日本シリーズ第1戦勝利阪神日本一確率」は62%」

https://www.sponichi.co.jp/baseball/news/2023/10/28/kiji/20231028s00001173607000c.html

ほほー、阪神の優勝確率は62%→(情報なし)→21%→46%→75%、と変化したわけですね。。。っていうか、それぞれの時点で勝ち星見ればいい話で、「優勝確率」なんていう大層なものでは全然ないような???

とはいえ検討余地はあると思った。

例えば3勝2敗の時点から勝敗場合

●◯

●●

の3通りしかなく、そのうち阪神が優勝するのが2通りなので、お互いの勝利確率50%だとすると、66%の確率阪神が優勝する。しかし、データから見ると75%優勝なので、それよりも高い。どれくらい高いかというと、オッズ1.1倍くらい高い。と言うようなものである。確かに3勝2敗に先に到達したチームの方が優勝する確率が高くなるが、その程度はわずかであろう。1勝すれば優勝するが相手は2勝しなければならない、と言う事実から普通に想像できる確率と大差はない。さてこの高いと言うのは有意なのだろうか。統計によると

今年のように2勝2敗(引き分け含む)から王手をかけたケースは、過去28度。そのうち優勝21度のV確率75%。

とのことである。二項検定すると

> binom.test(21,28,p=2/3)

Exact binomial test

data: 21 and 28

number of successes = 21, number of trials = 28, p-value = 0.4258

alternative hypothesis: true probability of success is not equal to 0.6666667

95 percent confidence interval:

0.5512845 0.8930920

sample estimates:

probability of success

0.75

であるので、危険度5%において有意ではない。つまり、2勝2敗から先に王手をかけた方が日本一になる確率統計的に高いと言うことはない。単に3勝したので日本一まで1勝で済むから日本一になりそうだ、と言うだけのことで、過去統計を引き合いに出す必要もない。

初戦を勝ったチームの日本一確率62%、についても考えてみよう。この場合は、初戦を勝ったチームをもとに、2戦目以降が

3勝0敗 → 1通り

3勝1敗 → 3通り (最後勝利が固定していて、3_C_1)

3勝2敗 → 6通り (4_C_2)

3勝3敗 → 10通り (5_C_2)

2勝4敗 → 10通り (最後に敗北が固定していて、5_C_2)

1勝4敗 → 4通り (4_C_1)

0勝4敗 → 1通り

なので、阪神が優勝する確率は(1+3+6+10)/(1+3+6+10+10+4+1)=0.5714286

データによると、

過去73度の日本シリーズで、第1戦で先勝したチームは45度日本一に。

とのことなので、有意性を二項検定で見てみると

> binom.test(45,73,p=20/35)

Exact binomial test

data: 45 and 73

number of successes = 45, number of trials = 73, p-value = 0.4791

alternative hypothesis: true probability of success is not equal to 0.5714286

95 percent confidence interval:

0.4952062 0.7279136

sample estimates:

probability of success

0.6164384

となって、やはり特に有意差はありません。

この簡単統計解析によれば、日本シリーズは「4勝した方が日本一になる」と言う以上の意味特になく、勝ち方(第一戦で先勝する、とか、2勝2敗から勝ち越す、とか)によって日本一になる確率が左右されることはなさそう。もっといえば、「勝ち星が多い方が日本一になる確率が高い」って、当然のことなだけ。

と、統計初心者が考えてみましたが、統計猛者のコメントがあればお願いします。例えばマルコフ過程としてモデル化することができるのかな。何かパラメータを入れて(例えばホーム球場での勝率確率は高いとかなんとか)、優勝確率が、何も考えず出す確率よりも高くなることに寄与するような因子を探す、とかだとセイバーメトリクス的になるのかも。

  • の3通りしかなく、そのうち阪神が優勝するのが2通りなので、お互いの勝利確率が50%だとすると、66%の確率で阪神が優勝する。しかし、データから見ると75%優勝なので、それよりも高い ...

  • もう一度、確率統計を勉強し直せい。

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん