暇人大学放浪記

モラトリアムを持て余した暇人が日々起こった出来事に対する所感を徒然に書いていきます。

お題目

検査装置の精度と国民一斉検査について考える

はじめに

 コロナウイルスで自粛ムードが漂っている。ニュースを見ると『PCR検査』という文字をよく目にする。この数カ月で随分と有名になったものだと感じる。思い返せば、1年前の今頃。自分はPCR検査に関連した研究の発表資料を携えて就職活動をしていた。当時は「何だ?この得体のしれないものは。」という雰囲気が大半で、理解を得られず大変苦労した。今就職活動を同じ資料でしたなら、結構すごい研究だと逆に買いかぶって評価されるのではないかと思ったりもする。結局時代とはその程度のモノなのかもしれない。まぁ、結局学士の時に逃げた研究テーマだし、結果は出ていないのでどっちでもいいのだが。(笑)

 バイオ研究というものを3年間程度、業界の隅から眺めてみると気づくことがあった。それは、基本的に結果が安定して出ないという意外な欠点だ。さっき出た結果をもう一度やっても同じ結果が出ない。こんなことがザラにある。これを専門用語で、『再現性がない』と呼ぶ。かっこよく言えば『不確実性』という風にも表現できそうだが、やっている本人からしたらとんでもない話だ。 だから、バイオ関係の検査装置は、市販のものもそこまで精度が高いわけではないというのが僕の個人的な見解である。(それでも、市販のものは研究レベルに比べて勿論精度もよく、再現性もある。)だから、結果は試験担当者により、当然ばらつくだろう。誤検知もそこそこあるだろうと思う。

 当時の僕は検査装置の誤検知というものをちゃんと理解していなかった。理解する余裕もなかったし、能もなかったというのが正直なところだ。確率が多くて、混乱したという経験もあった。しかし、最近たまたま下記のような動画を見た。


基本的な数学でコロナウイルス検査を全員にしても意味がないことを証明してみた

 この動画を見て、誤検知や検査装置の精度についてなるほどと思うことがあった。なので検査装置と誤検知というテーマで1個まとめてみたいと考えた。本エントリーでは、先の動画の内容を抽象的に(ワザワザ)焼きなおし、検査装置の誤検知というものを考察する。最後に、一斉検査をなぜ今の段階で行わないのか?行ってもいい条件というものをまとめたいと思う。主な内容は最初に挙げたYoutube動画が全てであることを先に明記する。(そっちの方が分かりやすいかもしれない。(笑))

取っ散らかった文章になるだろうが優しく読んでいただけたら幸いである。(誤字脱字はご愛敬)

誤検知というものについて

 先の動画では誤検知について具体例をもって詳しく解説されている。大変優れた動画だと感じた。特に言及することは本来ないのであるが、ここで使用されている具体例をもう少し一般化してみたいと思う。

 人口N人の国で有病率*1aの病気が流行ったとする。

検査精度*2bの検査装置で国民全員を検査する。検査陽性と出た時、その人が本当に病気に罹患している確率はいくつか。

この問いから考えを進めていきたいと思う。上の問について、考えをまとめたのが以下の図1である。

f:id:kazubon35_2438168:20200428201057p:plain
図1:検査結果の人数模式図

図から、本検査を全国民に実施した時、陽性と出た場合、本当に病気に罹患している確率は、以下の様になる。

 \frac{TP}{TP+FP}=\frac{a\times b}{a\times b+(1-a) \times (1-b)}

上の問の答えも重要だが、今回は、この過程で出てきた誤検知、FP(偽陽性)、FN(偽陰性)について考えていきたい。

➁FNの意味

 ここで、赤色の誤検知の内容をそれぞれ考えていく。➁のFN(偽陰性)というものは、検査において一番大事な指標だと私は考えられる。なぜなら『偽陰性が高い』とは、『病気に罹患しているのに陰性と出て、また日常生活に戻る人数が多い』ということを表しているからである。このような人数が多ければ多いほど、コロナなどで言うパンデミックの可能性が大きくなってしまう。つまり、実際の検査精度を上げるということは、FN(偽陰性)をできる限り下げることだと読み替えられる。

③FPの意味

 偽陽性が増えるとはどういうことか、考えてみる。この結論は、先の動画でも開設されていた。結局、『③のFP(偽陽性)が増える』とは、『医療コストが増大しやすくなる』という風に考えられそうである。(間違ってたらゴメン。)細かく言うと、FPが多いと、再検査をしなくてはならない。

ここで1回目での検査結果をそれぞれ、TP_1FP_1とする。この後、陽性になった母集団で再び検査をした結果、得られる真陽性の人数と偽陽性の人数は以下のようになる。

2回目の検査で偽陽性になる人数と真陽性になる人数

FP_2 = (1-b) \times (TP_1+FP_1)

TP_2 = b \times (TP_1+FP_1)

これを繰り返して、m回目の検査をした後もそれぞれの人数は以下式のようになる。

m回目の検査で偽陽性になる人数と真陽性になる人数

FP_m = (1-b) \times (TP_1+FP_1)

TP_m = b \times (TP_1+FP_1)

以上から検査精度bを大きくしないと偽陽性の人数は変わらず、何度も検査をする必要が出てくることが分かる。

真陽性が偽陽性より大きくなる条件

FP \leq TP

上式を解くと以下式を得る。

真陽性が偽陽性より大きくなる条件

a+b \geq 1

効率の良い(偽陽性人数が真陽性の人数より少ない結果を得るような)検査を上式の様な条件として得る。

全国民一斉に検査を行う条件の考察

 図1を見た時、願わくば青色の人数が増え、赤色の人数は減ってほしい。そのような状況はどのような状況だろうか?仮に一斉検査をすべき状況を下の様に定める。

 TP+TNの人数>FP+FNの人数

つまり、図から以下のような条件が出てくる。

一斉検査をすべき条件

 b\geq \frac{1}{2}

以上から、検査装置の検査精度が、0.5つまり、50%以上を満たす時、全国民一斉検査を検討する余地があるという判断ができる。 しかし、このままでは、FP(偽陽性)人数が多く出て、医療コストが上がる可能性があるため、前節の結果も踏まえて検討する余地がある。

まとめ

効率の良い一斉検査を行うためには、検査の時、以上の考察から、以下の2条件を満たす必要があることが分かる。

 b\geq \frac{1}{2}

a+b \geq 1

まとめると以下図2のようになる。(境界線は領域に含まれる。)

f:id:kazubon35_2438168:20200429010819p:plain
図2:一斉検査可能領域模式図

先の動画で、PCR検査の検査精度は、50-70%(b=0.5-0.7)と言われていた。

これを踏まえた具体例を最後に示してみたい。

例えば、有病率a=0.1%、検査精度b=70%ような場合では、図2の赤枠の領域の中に入らないため一斉検査の実施の必要がない。

しかし、有病率a=30%、検査精度b=70%ような場合では、図2の赤枠の領域の中に入るため一斉検査の実施の余地があることが分かる。

以上具体例から、感染者がある程度増えない(有病率がある程度高くなる)と一斉検査を行った効果は得られにくいことが分かる。 現在日本の総人口は1.2億人、コロナ感染者は1万人程度であるので、a = 0.000083となる。以上から一斉検査をするには、ほぼ100%の検査精度を誇る検査装置が必要になるが、これは現実的ではない。結局現状の日本では、3600万人がコロナにかかるまで一斉検査はやらないことになる。でもそんな状況って既にパンデミックだから、日本はそれどころではないってことになる。結局いずれにせよ一斉検査は現実的ではないと気づく。

おわりに

 Youtubeに端を発して、一斉検査をどのような状況で行うべきかどうかという考察までをおこなった。(あくまで個人的見解の範疇を出ていないことを注意)この結果から、以下のような結論を得た。

・ある程度感染者が出てからでないと、一斉検査実施の効果は薄いこと

・(当たり前だが)なるべく検査装置の検査精度を上げる必要があること

最後にPCR検査について軽く言及しておく。PCRの初歩は、高校の教育課程にも組み込まれている。*3現在の検査装置は、これをベースに開発されているが、その原理を理解するには、未だやや段階があると言わざるおえない。今回、欲を言えばPCR検査についてもまとめたかったが体力がなかった。本記事では割愛し、また自分のやる気が出たときにまとめてみたいと思う。

参考・注釈

*1:有病率:病気に罹患する確率。(有病率)=\frac{(病気にかかった人数)}{(全国民の人数)}

*2:検査精度:病気かどうか正しい検査結果が出せる確率。(検査精度)=\frac{(正しい検査結果を出した数)}{(全検査数)}

*3:詳細の動画がここにあるので示しておく。私はこれでPCRの初歩を学んだ。予備校様様である。https://www.youtube.com/watch?v=aToEfynKss4