医療だけでは幸せになれない

「検定」の危うさと「推定」のあいまいさ…医者も理解しているとは限らない

コロナ5種移行で、マスク着用は個人の判断に
コロナ5種移行で、マスク着用は個人の判断に(C)日刊ゲンダイ

「検定」と「推定」の続きである。統計学的な考え方は、身近であるようで、数学的に正確に理解しようとすると途端に難しくなる。実際、多くの医者も統計学を苦手にしている。統計学は多くの医学部で必修科目である。

 しかし学生時代は統計学が卒業後に臨床医として働く中で必須の学問であるという認識は薄く、試験が終われば忘れられてしまう。それが、私自身の学生時代の多くの学生の現実でもあった。

 そうした統計学の医学教育の中での位置づけが、卒業後の医者にどう影響しているのか。驚かれるかもしれないが、臨床医の大部分は日常的に医学論文を読む習慣がない。特に60歳を過ぎるような私の世代で、開業医であればなおさら、その傾向は強くなるだろう。背景には、多くの医師が学生時代の統計学の勉強を忘れ去り、その後、学び直す機会もなくその知識を欠いたまま忙しい日々が過ぎてしまい、医学論文を読めない、読まないという現実がある。

 さらに言えば、医学論文を日常的に読んでいる医者であっても、その読みが統計学の誤用であることが多い。

 ありがちなのは、統計学的な検定結果をそのまま臨床的な有効性であるとの読み方をしてしまうことである。論文全体を読むことなく、「統計学的に有意な効果があった」「統計学的に有意な効果はなかった」との結論部分だけをうのみにしてしまうのである。

 1つ例を挙げるならば、これまで取り上げてきたデンマークのランダム化比較試験の結果を、「危険率が38%で5%より大きいのでマスクの効果はない」と判断してしまうことである。逆にこの論文が示す危険率が5%より小さければ「マスクは有効だ」と判断してしまうのも同様な間違いである。

■「統計学的な有意差」と「臨床的な有効性」は別物

 そもそも危険率から「効果あり/なし」の判断をするのは、統計学的にも簡単なことではない。

 危険率は、マスクを着けるよう勧める行為が、勧めない場合に対して、「まぐれで効果ありとなる確率」と考えればよいと前回説明した。

 そもそも、まぐれで効果ありとなった可能性が5%より小さければ、まぐれではなく真に有効とするのも、実は伝統的、習慣的に決まっているにすぎない。危険率5%、つまり20回に1回の偶然は許容しようというのは、極めてあいまいな基準で、もっと緩くする基準を利用することも可能だし、もっと厳しい基準を採用することも可能である。そこに科学的に明確な基準はないのである。

 重要なことは、危険率から「有効/有効でない」という、はっきりとした判断をする統計学的検定には大きな問題があるということである。そこで最近は「危険率による検定」ではなく、「信頼区間による推定」を用いようとする大きな流れがある。結果のあいまいさをあいまいなままに理解しようという方向である。

 デンマークの研究では、コロナ発症率の絶対危険減少の95%信頼区間がマイナス1.2~0.4%と報告されている(95%信頼区間とは同じような研究を100回行えば95回はその範囲に収まると推定されるものを指す)。

 ただこれも「95%」信頼区間であって、「危険率が5%より小さいと有効」というのと同様にあいまいに決められた範囲に過ぎない。

 しかし信頼区間による推定は、このあいまいさをそのまま受け入れ、95%というあいまいな基準で示される範囲の中で、「効果を大きく見積もった場合には1.2%コロナ発症を少なくするかもしれない」「小さく見積もった場合には0.4%増やすかもしれない」というふうに、有効/有効でないという紋切り型の判断に結び付けず、臨床的にマスクを勧める/勧めないという判断に直接結び付けないようにしている点で、検定結果を直接臨床的な行為につなげてしまう間違いを避ける効果がある。

 これが、統計学的な検討が検定から推定へと移行している背景のひとつなのである。

名郷直樹

名郷直樹

「武蔵国分寺公園クリニック」名誉院長、自治医大卒。東大薬学部非常勤講師、臨床研究適正評価教育機構理事。著書に「健康第一は間違っている」(筑摩選書)、「いずれくる死にそなえない」(生活の医療社)ほか多数。

関連記事