2021-01-25

統計学素人GoToトラベル論文斜め読みする(追記あり

2021/01/29追記:西浦氏から解説記事が上がったのでこちら読んだ上での追記も適宜行ってる。

m3.com/open/iryoIshin/article/873130/

翻訳ミスってたので修正。指摘ブコメ感謝です。

https://www3.nhk.or.jp/news/html/20210125/k10012831381000.html

この記事ブコメでみんな疑問に思ってるっぽいので、素人でもわかる範囲のことを書いてみた。

この論文は何を書いてるの? 何をしてるの?

https://www.mdpi.com/2077-0383/10/3/398/htm

2020年7月22日GoToトラベルキャンペーン開始と新型コロナウイルスとの疫学的影響の可能性について調べて見たっぽい。

ファーストオーサーが安齋麻美さん(修士博士のどちらか)で西浦博教授も著者に含まれる。北海道大学衛生学研究室での研究っぽいですね。ごめんおもっくそKyoto University School of Public Healthって書いてたわ。京都大学大学院医学研究社会健康医学系専攻でいいですかね…。↓は北海道大学時代のページでふ。

http://hygiene.med.hokudai.ac.jp/member/

疫学データ

47都道府県確認症例プレスリリースデータ全て。うち24都道府県県境越えパターンの移動データありで、発症7日前(一部14日前)に県境越えした人を旅行履歴ありと判断したっぽい。

分析範囲

2020年5月1日8月31日までで、データ確認時期は2020年11月中旬。「症例確認できた日」と「COVID-19確認ができた日」の2パターンで進める。

基準は「県境越えしたかどうか」。なお、さらにその人達県境越えの目的を「ビジネス」「家族に会いに(帰省)」「観光」の3パターンに分類。

統計分析方法

データを3つに分類して、罹患比率IRR)を分析。ここのIRRsってのが割合数値として重要ものっぽいのだけれど、どうやら疫学統計的に意味のある指標っぽい。あとで斜め読みした結果を書く。

・1.GoTo前の期間(この期間は 1a.2020年6月22日7月21日 と1b.2020年7月15日~19日 の2パターン用意)

・2.GoTo初期の4連休含む5日間(2020年7月22日7月26日

・3.GoTo後期(8月8日8月31日

GoToの走り出しが4連休だったので、そこでの影響を主に見たいと思われる。1が2パターンあるのは、2が5日間だけだから1bで日数と期間を揃えた。3はGoToトラベルクーポンの利用期限が初期は8月31日までで、お盆帰省が増えるから増加するため、その辺りでの影響が懸念されたからっぽい。

結果記述

追記:元論文の"description"って独特な表現だなとは思ってたけど上手い訳が思い浮かばずとりあえず「結果」って書いたんですが、西浦氏の応答の中にこのようなものがありました。

疫学研究の中で、今回の研究は観察研究(observational study)、特に記述疫学研究(descriptive study)と呼ばれ、そこから得られる科学エビデンスレベルは低いことで知られます。つまり位置づけとしても、今後のために「因果関係検討すべき」と呼び掛ける程度の役割をしている研究に相当します。

m3.com/open/iryoIshin/article/873130/

まり、ここでの「記述」とは上記記述疫学研究特有表現である可能性が高い。これは斜め読みじゃ絶対わかんない情報だった。ありがたい(追記終わり)

ここから先はリンク先のグラフ見ながら読んでほしい。

まず、基礎的なデータとして、2020年5月1日8月31日までに確認された24都道府県で合計3978件の症例に対し、

と、症例の報告数そのもの7月8月で減っている。減少傾向にある。

で、以下肝心のGoToの3期間のデータ比較発症日と感染確認日の2軸パターン分析

この辺、しつこいようだけれど、グラフで見ないとマジでなんのことかわからないと思うので、グラフ見てほしい。視覚にわかやすくなってるので、そっちの方が直感的。

ディスカッション

多分結論というかこの統計データ示唆していることについての項目。

  1. 旅行関係場合、1aデータだと発生率が3倍、1bだと発生率が8倍になっている。
  2. GoToトラベルキャンペーン県境の横断を伴うCOVID-19の症例増加を初めて示したデータっぽい。IRRsが全部1を超えてる。
  3. ちょっと分析としては単純すぎるので因果関係証明できなかった。もっと別のファクターあるし
  4. この研究4つくらい留保してほしいことがあるとして「①都道府県によってデータバイアスあるかも」「②確認バイアスある、若い人が移動性高いの当たり前だし」「③直接的な影響だけでなく間接的な影響も調べた方がいい」「④旅行地域クラスタ増加してないかみたいな、定量化した疫学的影響がまだ足りてない」

読んでわかったこ

まず、IRRって数値が何度も出てくる。で、IRRが1.44という数字があり、どうやらこれがNHKニュースの「1.44倍」という数値の根拠になっているっぽい。

これ、なんのことかなと少し考えたが、わからなかったのでググって以下PDF確認した。

http://univ.obihiro.ac.jp/~kayano/epi-stat/epi-stat2.pdf

これもあんまりよくわからなかったが、計算式とか斜め読みした感じだと、どうやら「A期間でx%だったのがB期間でy%になった場合に、yをxで割ったとき数字」っぽい。だから、この場合の「倍」ってのは「感染者数」ではなく「感染者のうちの旅行した人の率」のことっぽい。ここ、多分「倍」と言われたときに思い浮かべる直感的な感覚乖離しているので要注意と思われる。

なお、CI=95%は統計上の信頼区間のことで、本当は色々説明した方がいいんだろうけど統計学は素人なので「まあほぼこの辺の範囲で正しいっすよ」くらいの意味で捉えてもらえればいいんじゃないかと思う。

感想

まあ、書いてるとおり因果関係わからんけど、GoTo期間で旅行関係での感染率が増えたのは事実っぽい。いくつかの指標で何パターンIRRを出して全部1超えてるので、統計的に「増えた」という事実は覆しようがないように見える。ただ、4連休旅行者増えるのはまあ当たり前っちゃ当たり前とは言えそう。

あと結局3の期間のデータを用意した意味がよくわかんなかった。データは用意したけどあんまりはっきりと言えるような情報がなかったか論文の報告内容として省いたのかな。それならまあ意図はわかる(研究してみたけど特に意味ありませんでした、は研究報告として重要)。

あと、増田統計学の素人ですが、統計データ因果関係(AがあったからBが起きた)ではなく相関関係(Aが起きると同時にBも起きているが、その二つの間にどんな関係があるかは不明)を出すものなのはわかっているので、これだけを以てしてGoToトラベル否定論に繋げるのはやや早計に見える。

個人的感想をまとめると、「増えたのは増えたけどめっちゃ増えたと言いきるのは難しそうで、連休から増えるのはあたりまえの気もするし、でもまあ増えるのはわかりきったことだったから減らす努力が足りなかったのではと言われるとそんな気もする、考えれば考えるほどよくわからなくなるので正直これだけではなんとも言えんなー」、という印象。

こういう研究政策に活かされるといいですね。

なんでこんな記事書いたの?

なんかNHKニュース岩田健太郎Twitter後追いしたっぽい感じがして、その割になんか内容ふわふわしててちょっと反応に困るなーって思ったんですよね。だから論文に当たればなんかわかることあるかなーって読んでみたら、まあNHK記事も書いてることは間違ってなくて、むしろ岩田健太郎さんの方が「関係アリアリ」って言い切っちゃっててそれは大丈夫なのかと感じました。

https://twitter.com/georgebest1969/status/1353186823229476867

あと、いざ読んでみたらやっぱりよくわかんねーなーって印象をどうしても抱いたので、素人が長文感想かいたら本職の統計増田疫学増田がなんか補足して知見を広めてくれたら嬉しいなーという下心もある。

なんか間違ってたら教えてください。

追記

一晩経って自分が何にもやっとしたのかわかった、NHKがなんでこの論文報道したのかがわかんないんだ。

これってある種の議論たたき台というか、この発表を取っ掛かりに他の論文で「じゃあ次はこうしましょう」「この論文カバーできてなかったこの部分調べましょう」みたいなことをやっていく為の第一歩で、正直報道するほどの内容なくない?

  • 増田が氏のTwitter見ている意味がわからないファンなの?   論外でムカつくからみてないけど2ー3月知ってるだけでこんな感じだったぞ マスク不要を唱えたり (中国もアメリカの疫学者...

    • >> 一つ有益なことをつぶやいておくと、日本のツイッタラー感染症医として多数のフォロワー数を誇る岩田先生とEARL先生は、一時TLで深刻なレベルで争っていたくらいマジで仲が悪い ...

    • 箇条書きみたいな言い切りしてなくね? 「このデータによると〜かもしれない」ではずしたとしても別に科学者としては間違ってないと思うが

  • 俺もざっと読んで同じ感想だったので西浦解説を待っている

  • GoTo肯定派は自分たちは何も示さず否定派に悪魔の証明求めるかもな。 どうせ面倒になったら経済が~言って有耶無耶にするんだろな。もう半島のやり口。

    • ベクトルでしか見てない人、ってこういう人か 「論文だけでは確定するのは早いんじゃない?」→「GOTO肯定派だ!」

    • 最近は半島とかナチュラルに言っちゃうネトウヨもちゃんと政府批判するようになったのか よかったな

      • むしろナチュラルに人種差別するタイプは前から政府に批判的だよ。 こういう層は桜井を支持しちゃったり、一周回って山本太郎を支持し始めたり、共産党こそ真の保守だ、とか言いだ...

    • 経済がーとかいって有耶無耶にしたりって安倍政権の時からずっと続いてるだろ 今更何言ってんだ

    • どちらかというと、GOTO否定派が言う「感染へ影響がなかったことを示せ」のほうが悪魔の証明なんだけどね。

      • 普通のGOTO肯定派は「主な要因ではなかった」と主張してるんだけどね まぁ否定派も肯定派も極端なことを言う過激派もいるが

        • おんなじことや。 「主要な要因であること」と「主要な要因でないこと」なら、後者のほうが悪魔の証明や。

          • 悪魔の証明とまでは言えないんじゃないか?主要の定義にもよるが

            • この先は統計学を勉強してくれ。 すくなくとも「否定派に悪魔の証明求める」という世界観なら、否定派が賛成派に求めてる証明こそが悪魔の証明。

              • 話にならなくて笑った

                • すまんな。 ここで統計学の基礎から方法論まで、大学の授業にすれば数十時間分の説明する気にはなれんのでな。

                  • あのね、あなたが他人の話を理解できないというもっとシンプルな話なのよ まぁ数十時間どころか一生かけてももう治らないだろうけど…

                    • 理解したうえで、君が統計学を理解できないとわかったから言ってるんですけどね。 これだけ言っても理解できないならもう無理だろうけど

      • 否定派は内容はともかくいろんなエビデンス出してきてるじゃん それを否定するなら否定するに足るエビデンス出さなきゃ

        • プレプリント中だからもうちょい待ってな。 なぜか8月のデータがあるのに言及していないこの論文と違って、11月までのデータを使った研究だから。

  • 個人情報以外の行動履歴取れてたらもっと面白いだろうに。 ウェーイ系が蔓延させてたって裏付けが取れて大した驚きも無かっただろうけど。

  • 読んだ。 元増田も触れてるけど4連休含みの5日間とそれ以外を比較するのは恣意的な気が… 特に旅行関連感染のうち観光関連感染の割合が増えるのはビジネス目的が4連休で減るのでそ...

    • 謝ったら増田に言質とられてネチネチ責められて、その後暴力振るわれると思って怖いんじゃないかな

    • 正直、この論文で言えてることは「GOTOで旅行者が増えてます」ってだけだな。 当然対象者が増えれば、その中で感染者も増える。 でも、GOTOがなかったらその人たちが感染してなかった...

      • GOTOがない世界線を用意できない以上、GOTOで旅行者が増えましたすら言えていない

        • これ以上は統計学の話になるから深入りしないけど、それは適切な仮定を置けばいい。 この論文はそこまでたどり着いていない。

          • 適切な仮定って?教えてよ

          • どんなに適切な仮定を置いたとしても 「もし仮定が正しければ○○と考えられる。」 までしか言えないんじゃないの?

            • その仮説が正しいと考えられる根拠をそろえる。 それが議論のメインになる。 これはそれがないから議論にならない。

  • 逆にこれで無関係とか言い出したらそれはそれでGOTOキャンペーンの経済効果が皆無ってことになってしまうので関係あったほうがいいのでは?

  • Gotoより入国制限が緩和された時期から爆増してるからそこんとこ指摘してほしいけどあんま言われないよね なんでや

  • 元増田が努力家でえらーい( ^^) _旦~~

  • ざっと見た限り、表のデータ矛盾していて、間違ってるっぽい(分析に影響があるのかはわからん)。 で、わかる範囲で修正するとむしろGOTOで減ったようにも見えてしまう。 ツイッタ...

  • 自民党とGotoは常に正しい まで読んだ

    • こういう理解のしかたしかできないヤツが「中国の核兵器は綺麗な核兵器」とか言うんだろう。

      • 中国人は広島長崎に謝罪しろ 自民支持者のネトウヨは常にそう呟いている

  • 実験室での条件を揃えた繰り返しの観察が出来ない分野では、そういった質の悪いデータから何とか意味あることを示せるように実験室でデータの取れる分野よりも統計分析の手法が進...

    • まだ査読されてないから、著者がこれで通すつもりなのか、ジャーナルがこれを許すのかがまだわからんが、 そういえば9年間も同じ感想を持ったわ。 あのうちどれだけがちゃんと査読...

  • id:n_231 そもそも、影響有無は本来GOTO推進した政府がデータ取って検証すべきことで、影響無しを政府が証明できない時点でアウト。接触アプリ必須化や陽性者のGOTO利用確認など政府が...

  • Gotoが立憲主導の政策なら共同通信や朝日はこの論文に対して何も言わなかったんだろうな

    • GoTo始めるのが遅かったからこうなったんだよ。 @ 立憲民主党支持者 「Go Toキャンペーン」遅れ「需要喚起つながらず」野党側批判 2020年6月30日 17時38分   30日野党側が行ったヒアリ...

  • 注目の施策の影響を検証したんだから社会的にインパクトがある 別にNHKが報道しても何の疑問もないわ こんな研究大したことないよ、って思ってる人、やってから言おうね

  • 教授先生が一般人に粘着しないのをいいことに素人のふりをしてかく乱工作的なコメントをする 自民党政権下ってこんなのばっかりだ

  • 追記 まぁそうだよね。 これを「決定版」みたいな言い方をするから疑問が噴出する。 データの問題、これはずっと言われていて、観光データは都道府県が持ってるから基準が統一され...

  • https://b.hatena.ne.jp/entry/4697551492665872194/comment/evans7 そも査読前の論文だから事実が証明されたかのように扱うのはおかしいわな。仮に因果関係が証明されたとしてもこの数字では感染拡大...

  • 中田大悟先生が論文に疑義を呈していたね。 ここから有益な議論が始まって欲しいのだけど、西浦先生の最近の振る舞いが政治的になりつつあるのを見ていると一抹の不安がある。果た...

    • ツイッターで論文に対して「有益な議論」ってアホじゃないかと思う 分析手法に問題があるならそういう趣旨の論文書くべきだよね

    • やっぱりTwitterでこの手のやり取りはやっちゃダメだね。 疑義のツイートだけ「専門家からも指摘があるようだ。信用できない」と拡散して、 西浦からの回答も来てるのにそっちは読ま...

      • 回答ってどこにあるの?

        • 自力でアクセスもできない人間がツイッターの「議論」を読む 何の意味があるのだろうか

          • 「ツイートと返信」の方にしか表示されないのか ツイッターの仕組みをよくわかってなかった

    • 飯田さんの解説が出たね。 https://note.com/iida_yasuyuki/n/nb2ad657d55e4 まぁおおむね自分も同じ感想かな。

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん