そんな時にはExcelで予測してみようぜ。(基本的な機能しか使っていないので、たぶん他の表計算ソフトでもできるはず)
ことを確認してみようぜ。
コロナウイルスに関するデータは、いろんな所から入手できる。WHOのサイトとかからがいいんだろうけど、Wikipediaなどにも転載されているのでそっちから持ってくるのがお手軽よ。
他人に発表する時にはきちんと一時ソースからにした方がいいけど、自分が疑問に思ったときにやる分にはどこからでもいいかと思う。
今回の場合は、今までの推移から、将来を予測する形になるので、例えば
と言う形で入れればいいよ。
この場合
で死者数の推移のグラフができるよ。
これでとりあえずどのように推移しているかのグラフを書くことができた。
これを感染者数にしてみよう。
一つのグラフに描画することもできるけど、値のオーダーがだいぶ違うので別のグラフに書いたほうがわかりやすいと思う。
グラフの中の曲線を右クリックして「近似曲線の追加」を選択する。
すると、通常は破線(点線)で近似曲線が追加される。
(新しいExcelの人は、グラフをクリックしたときに出てくる右側の「+」マークのボタンを使ってもいいよ)
この近似曲線を使って未来を予想するよ。
ただこのままだと直線近似のままになっているので、ぱっとみ会ってないように見えると思う。また、どれぐらいあっているかも分からないので、設定を変えてみよう。
ここから、種類を選べるので切り替えてみよう。
それぞれクリックして、いま選択している情報にたいして最も良さそうな近似曲線を選んでみよう。
また、その下に「予想」と言う欄があるので、そこに「前方補外」に100と入れると、近似曲線を今から100日後まで伸ばすことができる。
これで未来を予想する線がかけたよ。
その下にある「グラフに数式を表示する」と「グラフにR-2乗値を表示する」もONにしてみると、グラフ上に数字が表示されるよ。
数式は、この近似曲線を描くために使われる式で、これをExcelの式に置き換えて入れると、具体的なXの値の時の数字を計算することができるものになってるよ。
例えば、セル「E1」に「170」と入れて、この数式の「x」を「E1」に置き換えた式をセル「F1」に入れると、F1に170日の時の数字が出てくるよ。
また、R二乗値というのは、その近似曲線がどれだけあっているかを示しています。
ただし、未来を予測するときは、このR二乗値があっていればいいというもんでもなく…。
で、ここまで自分の手でやった人は気付くと思うんだけど、この近似曲線にどれを使うかによって無茶苦茶予測値に振れが出ます。
たとえば、指数近似にするとあと60日ぐらいで地球人類全員が感染し、そのうち10億人が死ぬと言う結果に。マジか。
一方で、線形近似にすると、100日後でも感染者数は数十万にとどまり、死者数は1万を超える程度、と言う結果になる。おいさっきと全然ちがうじゃねえか。
その中間ぐらいだと、累乗近似だが、100日後に感染者数は1000万人近くになり、死者は13万人を越える、と言う結論に。ビジュアル的にはこれが一番妥当なような気はするけど根拠ない。
それから、多項式をつかってグラフへのフィット度を上げた場合、最近ヨーロッパで本気になって検査を始めたことで急激に伸びた部分とかを拾っちゃって、値が極端になる、とかそういうことも確認できるよ。
分かりません。
結局グラフの姿を目で確認して考える、というのが一番オーソドックスなやり方。数学的にはいろいろと議論があるらしいけど…。
評価するときには、グラフを指数表示するか、普通の表示のまま見るかでどのグラフがあっているようにみえるか、と言うのもだいぶ見栄えが違ってくるので気をつけて。
ただ、どれが在ってるのかわかんないにしても、他人が出してきた数字やグラフをただ鵜呑みにするのではなく、自分でExcelでもなんでもにぶち込んでみれば、
と言うメリットがある。
数字が問題になっているとき、大抵の式はそんなに難しい事はないのでぜひやってみてほしい。Excelは結構優秀なので計算の中身をあんまり知らなくてもいけるよ。
また、このネタを覚えると、プレゼンするときに自分に最も都合のよい将来予測を作ると言うこともわりと自由自在にできるので、上司を丸め込んだり、客をだまくらかしたりもできるのでべんr…………悪用厳禁!!!。
もちろん、これは何か大きな異変がなくて、このまま状況が推移する場合の予想だ、ってことも分かると思う。そこから先は感染モデルなどを取り入れた、もっと高度な予想が必要になると思うけど、自分で推測するにはこの程度でも役に立つよ。
先日一部界隈で話題になった「全くスクリーニングされてないランダムな集団に検査を実施するとどんな結果になるか?」と言うのもExcelで簡単に計算できるのでやってみて。
また、一部の反発に「もっと検査精度はよいと想定するべきだ」とかあったけど、その数字がどれだけ大事なのか?とかも分かるよ。
100日後にはどれくらい人が死んでいるんだろう?
anond:20200319081017 そんな時にはExcelで予測してみようぜ。(基本的な機能しか使っていないので、たぶん他の表計算ソフトでもできるはず) そして、元の統計値の不確かさを別にしても、...
内挿じゃモデルフィッティングの目的関数が既知の観測値に対して最適化されるから予測にはならんよ。
あくまでも Excelできる範囲 「今のままで言ったらどうなるか」に答える と言う感じなんで厳密な所は別でお願いします
別に厳密でもなんでもなくただ内挿してるだけなのに予測と書くのは恥ずかしいレベルの間違いという話。
何かあなたの気にさわったならごめんなさい。でも恥ずかしがらなくても大丈夫だよ。書いたのはあなたじゃないのはよく分かってるから。
別に気に触ってないし、客観的に見て恥ずかしい初学者が犯しがちな間違いを指摘しただけですよ。
うん。そうだね、あなたは気に障ってもいないし、感情的にも、意固地にもなっていない。正しいことを言っているね。 でも、フォーカスが違う事を知って欲しいとも思うよ。もうこの...
なーに、礼には及ばない。
今日のガイジ
Excelできる範囲 Excelでも予測はできます。 「今のままで行ったららどうなるか」に答える 定常状態を仮定したとしてもフィッティングじゃ予測は不可能です。 選択で全然値が変わ...
Excelで予測が可能なの? 詳しく。 これでtrendやforecast関数が出てきたら笑う
hジャングルウィズティーのジャングルははまだがゴリラだってところからきてるもんだとばかり思ってたわ