意味が全くわからんが、まあしょうがないから少しだけ解説してやろう。間違いなく伝わらないとは思うが。
- まず検査というものは完璧ではない。検査で陽性となったからと言って、真に陽性とは言えず、実際は未感染だったという場合が確率的に必ず発生する。この割合(真に感染している人間のうち、検査で陽性となる割合)を「感度」と言う。covid19のPCR検査の感度が厳密にどのくらいなのかは分かっていないが、だいたい80%くらいという見積もりはある。https://jeaweb.jp/covid/qa/index.html
- 現時点の日本でワクチンを2回接種した人口の割合は約80%だ。つまりランダムに100人調査したとき、80人はワクチン2回接種済みということだ。
- ここで、8種類の可能性が考えられる。
- ワクチン2回接種している人間が感染している割合をp_vaccinated, ワクチン2回未摂取の人間が感染している割合をp_unvaccinatedと置く。調査対象の全人数をNとすると、8種類の可能性の人数は以下のようになる。なお検査の特異度は大抵の場合1のため今回もそう仮定する。
- 0.8 * N * p_vaccinated * 0.8 = 0.64 * N * p_vaccinated
- 0.8 * N * p_vaccinated * 0.2 = 0.16 * N * p_vaccinated
- 0.8 * N * (1 - p_vaccinated) * 0 = 0
- 0.8 * N * (1 - p_vaccinated) * 1 = 0.8 * N * (1 - p_vaccinated)
- 0.2 * N * p_unvaccinated * 0.8 = 0.16 * N * p_unvaccinated
- 0.2 * N * p_unvaccinated * 0.2 = 0.04* N * p_unvaccinated
- 0.2 * N * (1 - p_unvaccinated) * 0 = 0
- 0.2 * N * (1 - p_unvaccinated) * 1 = 0.2 * N * (1 - p_unvaccinated)
- 今問題なのは陽性と判定した人数なので以下の比較になる。
- 0.8 * N * p_vaccinated * 0.8 = 0.64 * N * p_vaccinated
- 0.2 * N * p_unvaccinated * 0.8 = 0.16 * N * p_unvaccinated
- さて、問題は、実際の陽性判定数と調査数Nが分かっているときに、p_vaccinatedとp_unvaccinatedが果たして異なるのかどうかを判定することである。上記の値は真の確率が分かっているとしたときの平均値であって、実際の観測では確率的な揺らぎによって必ずしもその値に一致しない結果が出る。観測値が真値にどの程度近いかは、一般には調査数が多ければ多いほど近づいていくと考えられる(一致推定量の場合)。
- PCR検査自体の現状の陽性率は10%程度なので、p_vaccinatedもp_unvaccinatedも仮に異なる値だったとしても10%に近い何らかの数字と考えれる。およそ1%とかそのくらいだろう。この確率を統計的に正しく推定するには何人くらいの調査が必要か?陽性率10%なら、ワクチン接種済みの陽性者数は0.064*N程度、未摂取の陽性者数は0.016*N程度だ。1000人調査したら64人と16人だ。さらにこの1/10程度である差異は、1000人の調査の場合は1人2人という数字でしか現れてこない。これが多少上下したところで、その数字による結論は意味があるものと言えると思うか?厳密にやるなら統計的検定をすればいいが、いずれにしても大した意味はないと考えるのが自然だ。
ツイートシェア