学術論文を読んでいると、信頼区間という言葉を目にすることが少なくありません。統計についてよく知らない場合でも、何となく意味が把握できるのでついつい、ちゃんとした意味を調べずにきている方も多いと思います。今回は、信頼区間について簡単にまとめていきます。
前回、このブログでP値について書きました。信頼区間はよく、P値と合わせて述べられていることが多いと思います。
例として、
①新薬Aという降圧剤を使用した群とそうでない群がある。
②統計学的処理を行うとP値が0.05未満という結果になった。
③95%信頼区間-15~-10mmHg
この場合、新薬Aを使用した群とそうでない群の間には、有意差があるということがわかります。しかし、具体的に何mmHgの血圧低下が見込まれるのかというのはP値だけではわかりません。
ここで、参考となるのが信頼区間です。信頼区間とは、真の差を含む区間であります。つまり、よく利用される95%信頼区間とは、95%の確率で真の値が含まれる数値の区間という意味になります。そのため、上記のような結果の場合では、95%の確立で真の差が-15~-10mmHg間にであるということです。
簡単に考えると、新薬Aを使用した場合、95%の確率で‐15~-10程度血圧が上昇するということになります。
では上記で述べた新薬Aに対して、新薬Bと比較を行ったとします。新薬Bのデータも新薬Aの時と同じようにサンプリングした結果、有意差があり95%信頼区間は-15~-13mmHgとなりました。
この結果を見たときに、新薬Aと新薬Bについてどのような違いが見て取れるでしょうか。
新薬Bの95%信頼区間は新薬Aに比べて狭くなっています。つまり新薬Bのほうがデータのばらつきが少ないということになります。
統計を勉強していると専門用語が所々に出てきます。それらの用語について、何となくではなく、しっかりと意味を調べ、自分なりに理解することで統計データが読み取りやすくなります。