2020-03-19

Excelグラフ新型コロナウイルス未来を予想する

anond:20200319081017

そんな時にはExcel予測してみようぜ。(基本的機能しか使っていないので、たぶん他の表計算ソフトでもできるはず)

そして、元の統計値の不確かさを別にしても、

ことを確認してみようぜ。

データの取得

コロナウイルスに関するデータは、いろんな所から入手できる。WHOサイトとかからがいいんだろうけど、Wikipediaなどにも転載されているのでそっちから持ってくるのがお手軽よ。

https://ja.m.wikipedia.org/wiki/2019%E6%96%B0%E5%9E%8B%E3%82%B3%E3%83%AD%E3%83%8A%E3%82%A6%E3%82%A4%E3%83%AB%E3%82%B9

他人に発表する時にはきちんと一時ソースからにした方がいいけど、自分が疑問に思ったときにやる分にはどこからでもいいかと思う。

データExcelへのぶち込み方。

今回の場合は、今までの推移から、将来を予測する形になるので、例えば

と言う形で入れればいいよ。

グラフを書く

グラフは散布図を使います

この場合

で死者数の推移のグラフができるよ。

これでとりあえずどのように推移しているかグラフを書くことができた。

これを感染者数にしてみよう。

ことで、簡単感染者数のグラフも作れるよ

つのグラフに描画することもできるけど、値のオーダーがだいぶ違うので別のグラフに書いたほうがわかりやすいと思う。

近似曲線を追加する

グラフの中の曲線を右クリックして「近似曲線の追加」を選択する。

すると、通常は破線(点線)で近似曲線が追加される。

(新しいExcelの人は、グラフクリックしたときに出てくる右側の「+」マークボタンを使ってもいいよ)

この近似曲線を使って未来を予想するよ。

近似曲線の種類や値を調整する

ただこのままだと直線近似のままになっているので、ぱっとみ会ってないように見えると思う。また、どれぐらいあっているかも分からないので、設定を変えてみよう。

ここから、種類を選べるので切り替えてみよう。

それぞれクリックして、いま選択している情報にたいして最も良さそうな近似曲線を選んでみよう。

また、その下に「予想」と言う欄があるので、そこに「前方補外」に100と入れると、近似曲線を今から100日後まで伸ばすことができる。

これで未来を予想する線がかけたよ。

数式とR2乗値を表示して評価し、あと具体的な値を拾ってみよう

その下にある「グラフに数式を表示する」と「グラフにR-2乗値を表示する」もONにしてみると、グラフ上に数字が表示されるよ。

数式は、この近似曲線を描くために使われる式で、これをExcelの式に置き換えて入れると、具体的なXの値の時の数字計算することができるものになってるよ。

例えば、セル「E1」に「170」と入れて、この数式の「x」を「E1」に置き換えた式をセルF1」に入れると、F1に170日の時の数字が出てくるよ。

また、R二乗値というのは、その近似曲線がどれだけあっているかを示しています

ただし、未来予測するときは、このR二乗値があっていればいいというもんでもなく…。

いろんな近似方法予測値を見てみる

で、ここまで自分の手でやった人は気付くと思うんだけど、この近似曲線にどれを使うかによって無茶苦茶予測値に振れが出ます

たとえば、指数近似にするとあと60日ぐらいで地球人類全員が感染し、そのうち10億人が死ぬと言う結果に。マジか。

一方で、線形近似にすると、100日後でも感染者数は数十万にとどまり、死者数は1万を超える程度、と言う結果になる。おいさっきと全然ちがうじゃねえか。

その中間ぐらいだと、累乗近似だが、100日後に感染者数は1000万人近くになり、死者は13万人を越える、と言う結論に。ビジュアル的にはこれが一番妥当なような気はするけど根拠ない。

それから多項式をつかってグラフへのフィット度を上げた場合最近ヨーロッパで本気になって検査を始めたことで急激に伸びた部分とかを拾っちゃって、値が極端になる、とかそういうことも確認できるよ。

じゃあどれが正しいのよ?

分かりません。

結局グラフの姿を目で確認して考える、というのが一番オーソドックスなやり方。数学的にはいろいろと議論があるらしいけど…。

評価するときには、グラフ指数表示するか、普通の表示のまま見るかでどのグラフがあっているようにみえるか、と言うのもだいぶ見栄えが違ってくるので気をつけて。

ただ、どれが在ってるのかわかんないにしても、他人が出してきた数字グラフをただ鵜呑みにするのではなく、自分Excelでもなんでもにぶち込んでみれば、

  • 近似方法や設定でこんなにも結果が変わる
  • どのパラメータがどれだけ結果に影響を与えるかを見ることができるので、抑えなきゃいけない論点が見えてくる

と言うメリットがある。

数字問題になっているとき、大抵の式はそんなに難しい事はないのでぜひやってみてほしい。Excel結構優秀なので計算の中身をあんまり知らなくてもいけるよ。

また、このネタを覚えると、プレゼンするとき自分に最も都合のよい将来予測を作ると言うこともわりと自由自在にできるので、上司丸め込んだり、客をだまくらかしたりもできるのでべんr…………悪用厳禁!!!

もちろん、これは何か大きな異変がなくて、このまま状況が推移する場合の予想だ、ってことも分かると思う。そこから先は感染モデルなどを取り入れた、もっと高度な予想が必要になると思うけど、自分で推測するにはこの程度でも役に立つよ。

さらに興味がある人向けに

先日一部界隈で話題になった「全くスクリーニングされてないランダム集団検査実施するとどんな結果になるか?」と言うのもExcel簡単計算できるのでやってみて。

これも自分計算すると納得するよ。

また、一部の反発に「もっと検査精度はよいと想定するべきだ」とかあったけど、その数字がどれだけ大事なのか?とかも分かるよ。

記事への反応 -
  • 100日後にはどれくらい人が死んでいるんだろう?

    • anond:20200319081017 そんな時にはExcelで予測してみようぜ。(基本的な機能しか使っていないので、たぶん他の表計算ソフトでもできるはず) そして、元の統計値の不確かさを別にしても、...

      • 内挿じゃモデルフィッティングの目的関数が既知の観測値に対して最適化されるから予測にはならんよ。

        • あくまでも Excelできる範囲 「今のままで言ったらどうなるか」に答える と言う感じなんで厳密な所は別でお願いします

          • 別に厳密でもなんでもなくただ内挿してるだけなのに予測と書くのは恥ずかしいレベルの間違いという話。

            • 何かあなたの気にさわったならごめんなさい。でも恥ずかしがらなくても大丈夫だよ。書いたのはあなたじゃないのはよく分かってるから。

              • 別に気に触ってないし、客観的に見て恥ずかしい初学者が犯しがちな間違いを指摘しただけですよ。

                • うん。そうだね、あなたは気に障ってもいないし、感情的にも、意固地にもなっていない。正しいことを言っているね。 でも、フォーカスが違う事を知って欲しいとも思うよ。もうこの...

              • 今日のガイジ

          • Excelできる範囲 Excelでも予測はできます。 「今のままで行ったららどうなるか」に答える 定常状態を仮定したとしてもフィッティングじゃ予測は不可能です。 選択で全然値が変わ...

            • Excelで予測が可能なの? 詳しく。 これでtrendやforecast関数が出てきたら笑う

    • hジャングルウィズティーのジャングルははまだがゴリラだってところからきてるもんだとばかり思ってたわ

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん