医療だけでは幸せになれない

論文と現実のギャップ…「サブグループ分析」で目の前の個人に近い人で解析

バングラデシュのダッカ
バングラデシュのダッカ(C)Meinzahn/iStock

 前回と同じ「論文結果と個人のギャップ」についてである。両者のギャップは埋めがたい。目の前の個人にぴったりする情報があることはまれである。ギャップがあるから論文に意味はないというのは簡単だ。しかし、意味がないと言ってみたところで、目の前の現実、個人にピッタリ合う論文がない以上、それに近い目の前の情報を意味あるものとして利用する選択肢以外にはない。

 前回は、論文の対象者と現実の対象者の違いそのものについて検討したが、今回はそのギャップを埋める手法の1つを紹介しよう。引き続きバングラディッシュの研究である。マスク着用群は、サージカルマスクと布マスクの2種類を使用している。これまで紹介してきた結果はその2つを合わせたものの結果である。

 仮に自身がサージカルマスクをしているとしたら、サージカルマスクのグループだけでどうであったかが知りたいはずだ。その期待に応えるべく、この論文ではサージカルマスクと布マスクのそれぞれの検討結果が報告されている。いずれも相対危険で報告されており、サージカルマスク群では相対危険0.874、95%信頼区間0.809~0.939、布マスクでは0.907(0.823~0.991)という結果である。いずれも全体の結果と大差なく、マスクの種類によって統計学的な効果に差はないという結果である。

 さらにこの論文では年齢ごとの効果の違いについて40歳未満、40歳代、50歳代、60歳以上の4つのグループでそれぞれ検討している。40歳未満の相対危険と95%信頼区間は0.967(0.834~1.1)、40歳代で1.009(0.817~1.2)、50歳代で0.772(0.595~0.949)、60歳以上で0.647(0.448~0.845)という結果である。50歳未満ではマスクの効果は明らかでなく、高齢者で効果が大きい傾向にあるという結果である。

■調査対象数が少ないと極端な結果も

 上記の、ある特定の集団を取り出して解析する方法を「サブグループ分析」と呼ぶ。全体の解析に対して、一部を取り出した解析である。その結果をそのまま受け取れば、サージカルマスクと布マスクに差はなく、50歳未満の人に対するマスクの効果は明らかでなく、50歳以上では相対危険で0.7、相対危険減少で30%(1-相対危険)程度の予防効果があるかもしれない、ということになる。しかしこのサブグループ分析には注意が必要である。

 1つは、前もって予定された分析であるかどうかである。研究開始後に予定していない分析として多数のサブグループ分析を行うと、偶然差が出てしまう危険が高くなる。この研究では年齢による分析は前もって計画されたものであり、その危険は小さいかもしれないが、無視していいかどうかはわからない。

 年齢による解析は4つのグループで検討されており、それぞれを有意水準5%で統計学的な差があると判断すると、少なくとも1つは統計学的に差が出るという確率は1-(0.95)⁴=0.19(注)と、19%の確率で有意差を検出してしまう。高齢者で差が出ているのはそうした結果かもしれない。

 ただし、サブグループ分析では一部の対象を取り出すため、検討に組み入れる対象者が少なくなる点に注意が必要だ。対象者が少なくなると、より極端な結果が出やすく、より効果があるとかまったく効果がないとか、極端な結果が出る危険が高くなる。さらには対象数が減ることにより、本来、差があるにもかかわらず、その差を統計学的に有意と言えなくなる危険も大きくなる。つまりサブグループ分析は、差が出やすい面もあり、出にくい面もあるというやっかいな性質がある。

 サブグループ分析について紹介すると、これまでも問題にしてきたように、「日本人のデータが見たい」という人が多くなる。しかし、その疑問はいささか的が外れている。そもそも重要なのは日本人に限った解析というより、目の前の人にあった解析であるか否かである。その1つの手法として今回紹介したサブグループ分析という方法がある。

 ただ、そこには統計学的に多くの問題があり、その解釈には慎重を要する。サブグループ分析から明確な結論を導き出すのは危険で、そこで仮説が証明されたと考えるのではなく、新たな仮説が提示されたと考えるのが妥当である。

 つまり、この研究から「サージカルマスクと布マスクに差はない」と結論付けるのも、「高齢者でマスクの効果が高い」というのも、新たな仮説として考慮したほうが統計学的には妥当であるということである。しかし、それはあくまで統計学的なことであって、個別の人にどうするかは、この結果を踏まえて個別に相談するほかない。

(注)偶然4つのうちの1つで有意水準5%未満で差を検出してしまう確率のこと。有意差が出ない確率は1つの検定では1-0.05=0.95であるが、これが4つ検定して1つも有意差が出ない確率になると(0.95)⁴である。この補集合が少なくとも1つは有意差が出てしまう確率になるので、「1-(0.95)⁴=0.19」と計算される。

名郷直樹

名郷直樹

「武蔵国分寺公園クリニック」名誉院長、自治医大卒。東大薬学部非常勤講師、臨床研究適正評価教育機構理事。著書に「健康第一は間違っている」(筑摩選書)、「いずれくる死にそなえない」(生活の医療社)ほか多数。

関連記事