医療だけでは幸せになれない

統計医学的検討…「有意差なし」は必ずしも「効果なし」の意味ではない

「有意差なし」が効果がないということではない
「有意差なし」が効果がないということではない(C)日刊ゲンダイ

 情報を基に医療を考えるには、統計学的な手法を知る必要がある。その統計学的検討には前回取り上げたさまざまな指標と、さらに「推定」と「検定」という2つの方法がある。情報を表す3つの「真実・バイアス・偶然」の点で言えば、偶然を検討するための方法が推定と検定である。

 指標については「割合」「率」「比」「差」など四則計算のレベルで理解可能な部分があり、それについては前回解説した。今回はそれに引き続き、統計学的検討の最も主要な部分である推定と検定について取り上げる。ただ、推定と検定は素人が手計算でできるようなものではなく、コンピューター、統計ソフトを必要とする。その全貌を私自身が理解しているわけではないので、ここではその検討結果の利用の仕方を中心に説明を試みたい。

 前々回取り上げたデンマークで行われたマスク推奨の効果を検討したランダム化比較試験の結果を見てみよう。その差はマイナス0.3%で、その95%信頼区間はマイナス1.2~0.4、危険率0.38。また相対危険はオッズ比で表され、0.82、その95%信頼区間は0.54~1.23、危険率0.33と報告されている。

 医学論文にはよく出てくるフレーズだが、統計学を学んでいない人には何がなんだかわからないと思う。その意味を解説しよう。

 まず、発症率の差がマイナス0.3%というのを、前回説明した絶対危険減少で示せば0.3%の発症減少ということである。減少の部分をマイナスで示したというだけである。今回の話題は、その指標の後に書かれた数字の範囲と1以下の数字である。この範囲で示されるのが信頼区間による推定で、1以下の数字で示されるのが危険率。この危険率をもとに行われるのが検定である。

■「推定」と「検討」を知る

 まず、信頼区間による推定から説明しよう。

 感染発症の差はマイナス1.2~0.4と示されているが、これは95%信頼区間と書かれているように「同じような研究を100回行えば95回はその範囲に収まる」と推定される結果である。効果を大きく見積もれば1.2%減らすかもしれないし、小さく見積もると0.4%増やすかもしれないと考えるとわかりやすいかもしれない。減らすかもしれないし、増やすかもしれない。減らすとも増やすともはっきりとは言えない結果である。ただ、いずれにしても効果は小さく感じられる。

 同じように相対危険であるオッズ比の方も見てみよう。95%信頼区間は0.54~1.23である。感染の発症を100から54に減らすかもしれないし、123に増やすかもしれない。こちらは、減らすにしろ増やすにしろ、それなりに影響がある結果に思うだろう。ただ、増やすとも減らすともはっきりとは言えないというのは、差で見たときと同様である。

 続いて危険率を見てみよう。差で見た場合は0.38、相対危険で見た場合には0.33とある。この数字を正確に解釈するのはむつかしいが、とりあえず「マスク推奨の効果があったとしても、その効果がまぐれであった可能性」と考えると理解しやすい。0.3%発症が減ったといってもまぐれの可能性が38%あるし、100から82に減らしたといってもまぐれの可能性が33%あるということである。まぐれで効果ありの可能性が30%以上ある、偶然効果ありという結果が出た可能性が30%以上である。故にマスクに効果があるとは言えない。これが検定のプロセスである。

 そこでまぐれの可能性、危険率がどれくらいであればまぐれでないと言えるのか、ということであるが、一般に医学論文では5%未満が採用される。この結果で言えば、5%以上なので統計学的に有意な差はないということになる。

 ここで重要なのは、まぐれで効果ありとした可能性、危険率が5%以上なのでマスク推奨の効果があるとは言えないが、効果がないとも言えないということである。統計学的な有意差がないという結果を見ると効果がないと判断しがちだが、そのような判断は間違っている。先の信頼区間で見たように、100から54に減らすとすれば効果があるといった方がいいし、123に増やすようなら効果がないどころか有害かもしれないのである。「有意差がない」というのは、減らすとも増やすとも言えないということに過ぎない。

名郷直樹

名郷直樹

「武蔵国分寺公園クリニック」名誉院長、自治医大卒。東大薬学部非常勤講師、臨床研究適正評価教育機構理事。著書に「健康第一は間違っている」(筑摩選書)、「いずれくる死にそなえない」(生活の医療社)ほか多数。

関連記事