医療だけでは幸せになれない

マスクの予防効果を検討…もうひとつのランダム化比較試験「バングラデシュの研究」

バングラデシュの研究では…(C)ロイター
バングラデシュの研究では…(C)ロイター

 これまで取り上げてきたことを一度まとめておこう。

 情報の表すものは「真実」「バイアス」「偶然」であって、バイアスには「情報バイアス」「選択バイアス」「交絡因子」がある。そのうち交絡因子をコントロールしたデンマークで行われたランダム化比較試験の結果を、差の指標である「絶対危険減少」と、比の指標である「相対危険」、さらにはその「95%信頼区間」、「危険率」も見ながら検討した。今回も同様に、バングラデシュで行われたランダム化比較試験の結果について検討していくことにしよう。

 この研究はバングラデシュの田舎で、自治体、家庭を対象として、マスク着用を勧める場合と勧めない場合において、症状のあるコロナ感染症の発症を比較したクラスターランダム化比較試験である。デンマークの研究が個人個人についてマスクを勧める/勧めないというやり方であったのに対し、この研究では自治体や世帯レベルでマスクを勧めるか/勧めないかという方法をとっている。この後者の集団ごとに推奨、非推奨を割り付けるランダム化比較試験をクラスターランダム化比較試験と呼んでいる。

 この研究の適切なマスク着用率もデンマークの研究と似ている。マスク推奨群で42.3%がマスクを着用し、非推奨群でも13.3%がマスクを着用したと報告している。感染予防効果は相対危険とその95%信頼区間で0.905(0.815~0.995)と報告されている。1000の感染を905に減らし、その幅は大きく見積もれば815まで減らすかもしれないし、小さく見積もっても995まで減らすかもしれない。小さく見積もっても多少は予防効果があるかもしれない、という結果である。危険率は0.03と5%未満、統計学的にも有意な差である。

 この結果をデンマークの研究と比較してみよう。デンマークの研究では相対危険が0.82とこの研究より効果が大きかったにもかかわらず、「統計学的にははっきりしない」という結果である。どういうことだろうか。

■有意差は研究規模に影響される

 統計学的に有意かどうかは、効果の大きさだけでなく、研究の規模にも影響する。研究規模、つまり研究の参加者が多ければ効果が小さくても統計学的に意味のある差だという結果を出せるのである。実際の研究への参加者を見てみると、デンマークの研究では6024人に対し、バングラデシュの研究ではその50倍以上の34万2483人である。

 さらにこの研究では布マスクとサージカルマスクの両方を使用しており、それぞれの検討結果も示されている。布マスクグループの相対危険と95%信頼区間は0.925(0.766~1.083)、サージカルマスクグループでは0.894(0.782~1.007)である。

 この結果だけを見ると、布マスクもサージカルマスクも統計学的に有意とは言えない結果であるが、これは2つのグループに分けたために参加者の数が減った影響が大きい。しかし、世に流れる情報の中にはこのグループ別の結果のみの結果を流し、統計学的な差はなかったと結論するようなものがある。

 こうした全参加者のうち一定の条件を満たしたものに限って行う検討を「サブグループ分析」と呼ぶ。サブグループ分析には参加者数が減少するために統計学的な有意差が出にくいという部分と、逆に極端な結果が出やすく有意差が出やすいという両面がある。いずれにせよ偶然の影響が大きく、どのような結果であっても注意が必要、有意差の有無を無条件に受け入れてはいけない。統計学的な有意差を見るのであれば、全体の検討結果のみを対象とすべきである。

 そこから得られる情報は、「マスク推奨により40%ほどの人が正しく着用して、1000の感染を905程度まで減らしたが、その結果は大きく見積もっても1000を815に減らす程度の効果かもしれない」というところである。しかし、ここまで読めてようやく医療の効果を検討した論文を読み、考えることのほんの入り口に立ったに過ぎないのである。

名郷直樹

名郷直樹

「武蔵国分寺公園クリニック」名誉院長、自治医大卒。東大薬学部非常勤講師、臨床研究適正評価教育機構理事。著書に「健康第一は間違っている」(筑摩選書)、「いずれくる死にそなえない」(生活の医療社)ほか多数。

関連記事