2021-08-05

GPT3で東京感染者数の予測をしてみる

テレビで流れた感染者数のニュースを眺めてたら、「7日ごとに感染者数が規則的に増減している」と「入力から出力を推測するのに優れたAI」が頭の中で繋がったので無料枠消費も兼ねて実験してみた。

手順

わざわざモデルを生成するのも面倒だったので、いくつかの例を与えてから予測させるfew-shotを使うことにした。

東京都データベースから感染者数の推移のデータを引っ張ってきて、pythonで少しコードを書いて送信するデータを作る。全部のデータ送信するのは入力の上限に引っかかるので、一部だけランダムで毎回取り出すことにする。

Predict the next number in the sequence.

487, 508, 472, 436, 351, 235, 369, 440, 439, 435, 467, 304, 209, 337, 501 => 452

1591, 2447, 2392, 2268, 1494, 1219, 970, 1433, 1502, 2001, 1809, 1592, 1204, 1240, 1274 => 1471

...

1832, 1979, 1359, 1128, 1763, 1429, 2848, 3177, 3865, 3300, 4058, 3058, 2195, 3709, 4166 =>

これをgpt3に投げると「最後の数列に続きそうな数」を出力してくれる(便利な時代!)。

昨日までのデータを使って今日感染者数を予測すると、

4171, 4176, 4177, 4266, 4266, 4266, 4335, 4335, 4335, 4335, 4335, 4339, 4347, 4491, 4500, 4500, 4500, 4961, 4962, 4963, 4963, 4963, 4963, 4963, 4963, 4963, 4963, 4982, 4982, 4983, 4984, 4984, 4984, 4984, 4984, 4984, 4984, 4984, 4984, 4984, 4984, 4999, 5166

1:2くらいで4300くらい派と4950くらい派に別れた。中央値は4963なので近いと言われたら近いのかな...?という結果。とはいえ、今までの感染者数は多くて4000人強しかいなかったのに、訓練らしい訓練もしていないAIが4900人近くの予測を出してきたのはかなり興味深い。

おまけ

今日感染者数を使って明日感染者数を予測してみた。(昨日の4166人ばっかり結果に出てきたからそれは外してる。なんでだろう?)

3177, 3177, 3177, 3177, 3177, 3177, 3177, 3177, 3177, 4177, 4200, 4200, 4200, 4200, 4200, 4200, 4200, 4242, 4963, 4963, 4963, 4983, 4983, 4983, 4984, 4984, 4984, 4984

3700/4200/4900で1:1:1に割れるってのもなかなか面白い

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん