はてなキーワード: マルコフ過程とは
全国のスポーツ紙野球誌面担当記者よ、刮目せよ(そんな大した話ではない笑)
この時期のプロ野球日本シリーズ関連記事を見ると、優勝確率、と言う数字が毎日踊るのである。
11/3現在「【阪神】日本シリーズで2勝2敗から王手のチームはV確率75%」
https://news.yahoo.co.jp/articles/4f54c052feb332637de4cbbda7fe1c7ac3dc8a80
ふむふむなるほど。(2勝2敗(引き分け含む)から王手をかけたケースは、過去28度。そのうち優勝21度のV確率75%。)
11/1「阪神追いつき29度目の2勝2敗、優勝確率は46%」
https://www.nikkansports.com/baseball/news/202311010001529.html
おお、前日には全く低かったんですね。
10/31「オリックスV確率は79% 1勝1敗から先に2勝目を挙げたチームが27度優勝」
https://www.nikkansports.com/baseball/news/202310310001318.html
ホウホウ、この時点ではオリックスが日本一になりそうだ、という話だったね、そういえば。
10/28「日本シリーズ第1戦勝利の阪神「日本一確率」は62%」
https://www.sponichi.co.jp/baseball/news/2023/10/28/kiji/20231028s00001173607000c.html
ほほー、阪神の優勝確率は62%→(情報なし)→21%→46%→75%、と変化したわけですね。。。っていうか、それぞれの時点で勝ち星見ればいい話で、「優勝確率」なんていう大層なものでは全然ないような???
◯
●◯
●●
の3通りしかなく、そのうち阪神が優勝するのが2通りなので、お互いの勝利確率が50%だとすると、66%の確率で阪神が優勝する。しかし、データから見ると75%優勝なので、それよりも高い。どれくらい高いかというと、オッズ1.1倍くらい高い。と言うようなものである。確かに3勝2敗に先に到達したチームの方が優勝する確率が高くなるが、その程度はわずかであろう。1勝すれば優勝するが相手は2勝しなければならない、と言う事実から普通に想像できる確率と大差はない。さてこの高いと言うのは有意なのだろうか。統計によると
とのことである。二項検定すると
Exact binomial test
data: 21 and 28
number of successes = 21, number of trials = 28, p-value = 0.4258
alternative hypothesis: true probability of success is not equal to 0.6666667
95 percent confidence interval:
sample estimates:
probability of success
0.75
であるので、危険度5%において有意ではない。つまり、2勝2敗から先に王手をかけた方が日本一になる確率が統計的に高いと言うことはない。単に3勝したので日本一まで1勝で済むから、日本一になりそうだ、と言うだけのことで、過去の統計を引き合いに出す必要もない。
初戦を勝ったチームの日本一確率62%、についても考えてみよう。この場合は、初戦を勝ったチームをもとに、2戦目以降が
3勝0敗 → 1通り
3勝1敗 → 3通り (最後に勝利が固定していて、3_C_1)
3勝2敗 → 6通り (4_C_2)
3勝3敗 → 10通り (5_C_2)
2勝4敗 → 10通り (最後に敗北が固定していて、5_C_2)
1勝4敗 → 4通り (4_C_1)
0勝4敗 → 1通り
なので、阪神が優勝する確率は(1+3+6+10)/(1+3+6+10+10+4+1)=0.5714286
データによると、
> binom.test(45,73,p=20/35)
Exact binomial test
data: 45 and 73
number of successes = 45, number of trials = 73, p-value = 0.4791
alternative hypothesis: true probability of success is not equal to 0.5714286
95 percent confidence interval:
0.4952062 0.7279136
sample estimates:
probability of success
0.6164384
この簡単な統計解析によれば、日本シリーズは「4勝した方が日本一になる」と言う以上の意味は特になく、勝ち方(第一戦で先勝する、とか、2勝2敗から勝ち越す、とか)によって日本一になる確率が左右されることはなさそう。もっといえば、「勝ち星が多い方が日本一になる確率が高い」って、当然のことなだけ。
と、統計初心者が考えてみましたが、統計猛者のコメントがあればお願いします。例えばマルコフ過程としてモデル化することができるのかな。何かパラメータを入れて(例えばホーム球場での勝率確率は高いとかなんとか)、優勝確率が、何も考えず出す確率よりも高くなることに寄与するような因子を探す、とかだとセイバーメトリクス的になるのかも。
私は北海道の学生です.情報系の学生をしています.また,他大学の共同研究もしていて,ここで"非常勤特任研究員"として主にリモートで従事していました.
普段は自分の卒業研究をしつつ,片手間で別の研究をしています.こちらのテーマは「人工知能と人工生命」です.マルコフ過程や隠れマルコフモデル,生命誕生シミュレーション等をやっています.
しかし,数日前の事件(これから書きます)により,私は解任寸前にまで来ています.
事の発端は数日前.その日は,自分は論文の提出締め切り直前で必死に論文を書いていました.
突然,Twitterアカウントのbot(既に消えていて分からない)が出てきて,そのbotがTweetをしてはRTをという事があったそうです.
そのbotの発言内容が発言内容(内輪ネタを吐き出す内容だったらしい)なため問題となり,「お前が作ったんだろ」のように言われ始めました.
勿論そんなbotを私は作っていません.(そんな余裕は微塵も無かった)しかし延々と疑われています.多分,今でも疑われています.
しかし,数名から「私を疑っている理由」を聞くことが出来ました.それは,下記の通りでした.
大きな理由は,これだけでした.
句読点を,.にしているのは別に好みではなく,論文執筆用です.場所にもよりますが,(,.)を使う論文のほうが多いですし,更に場所によっては、。を受け付けない学会もあります(査読で落ちる).
確かに私は共同研究で人工知能(生命)の研究に従事しています.雑談中にもそんな事は言ったかもしれません.
ですが,本学には人工知能の研究をされている先生は多いですし,比例して学生も多いはずです.
本学では1年生の科目に,一般教養としてリテラシ系の授業が多々入っています.それらを履修しているにもかかわらず,安直な判断をした1,2年生諸君には,残念ながら失望を隠せません. 恐らくもう,ずっと本学の後輩のことを信頼出来ないと思います.残念です.
今まで後輩にここまで失望したことはないです.ですが,これ以上は無理のようです.
これだけで話が終われば,まだ良かったのですが,このTwitterの騒ぎで,現在僕には「研究情報の具体性漏洩」に関する疑いが,共同研究先から持たれています.
この結果,始末書を書くことになりました.ここまでくると,どうして自分がこんな目に合っているのか,分からなくなります.
具体的な研究内容はそもそも本学に持ち込んでいませんし,論文やらは全部自宅にあります.深い内容は誰にも話していません.
17日,札幌へ行くことになりました.始末書を出しに,行ってきます.担当者が札幌に出張でいるので,出しとけ,とのことです.
3月で元々研究も終了(晴れて就職しますし)するし本学も卒業するので,もうここらへんもどうでもいいのですが,どうしてこうなったのか,わかりません.