はじめに

学術論文を読んでいると、信頼区間という言葉を目にすることが少なくありません。統計についてよく知らない場合でも、何となく意味が把握できるのでついつい、ちゃんとした意味を調べずにきている方も多いと思います。今回は、信頼区間について簡単にまとめていきます。

 

信頼区間とは

前回、このブログでP値について書きました。信頼区間はよく、P値と合わせて述べられていることが多いと思います。

例として、

①新薬Aという降圧剤を使用した群とそうでない群がある。

②統計学的処理を行うとP値が0.05未満という結果になった。

95%信頼区間-15-10mmHg


この場合、新薬Aを使用した群とそうでない群の間には、有意差があるということがわかります。しかし、具体的に何mmHgの血圧低下が見込まれるのかというのはP値だけではわかりません。

ここで、参考となるのが信頼区間です。信頼区間とは、真の差を含む区間であります。つまり、よく利用される95%信頼区間とは、95%の確率で真の値が含まれる数値の区間という意味になります。そのため、上記のような結果の場合では、95%の確立で真の差が-15-10mmHg間にであるということです。

簡単に考えると、新薬Aを使用した場合、95%の確率で‐15~-10程度血圧が上昇するということになります。

 

信頼区間の比較


では上記で述べた新薬Aに対して、新薬Bと比較を行ったとします。新薬Bのデータも新薬Aの時と同じようにサンプリングした結果、有意差があり95%信頼区間は-15-13mmHgとなりました。

この結果を見たときに、新薬Aと新薬Bについてどのような違いが見て取れるでしょうか。

新薬B95%信頼区間は新薬Aに比べて狭くなっています。つまり新薬Bのほうがデータのばらつきが少ないということになります。

 

さいごに


統計を勉強していると専門用語が所々に出てきます。それらの用語について、何となくではなく、しっかりと意味を調べ、自分なりに理解することで統計データが読み取りやすくなります。