前回は信頼区間についての基本と1標本の母平均の信頼区間についてまとめました。
しかし、研究や調査では2標本を比較対象とすることが一般的ですね。
そこで、今回は、母平均間の差の信頼区間(つまり「真の差」を、ある信頼度で含むと思われる範囲)についてまとめてみます。
2標本平均(母平均)の差の信頼区間とは
前述の通り、研究・調査における関心は2標本比較(特に2標本の母平均の差)であることが多いですね。
例えば、新しい治療を試した群とコントロール群の治療効果データを集めて、それぞれの平均値の差を比較することで、治療効果の判定を下すといったようなケースですね。
しかし、2つの標本平均の差がその母平均の差と一致するかどうかは不明です。
そこで、2標本平均の差を信頼区間で捉えることで、真の母平均の差を含む可能性のある範囲を推定することができます。
例えば、周辺地域(住んでいる県)の20代と70代男性の握力平均の差を推定したいと考えます。
県内すべての20代と70代男性の握力測定をすることは不可能ですから、代わりに、それぞれの集団から15人を無作為抽出し、それぞれの標本の平均握力を求めて、2つの母集団の平均握力の差を推定することができます。
問題は、2標本から得られた平均握力の差が、2つの母集団の平均握力の差と正確に一致することが保証されないことです。そこで、この不確実性を捕らえるために、2つの母集団のの平均握力の真の差を含むと思われる信頼区間を推定します。
母平均の差の信頼区間の公式
2標本(母)平均の差の信頼区間の公式は、
$$信頼区間 = (\bar{x_1}-\bar{x_2}) ± t×\sqrt{((s_p^2/n_1) + (s_p^2/n_2)})$$
ここで
- \(x_1\)、 \(x_2\): 標本1の平均、 標本2の平均
- t: 信頼水準と自由度(\(n_1\)+\(n_2\)-2)に基づくt臨界値
- \(s_p^2\): プールされた分散
- \(n_1\)、 \(n_2\): 標本1のサイズ、標本2のサイズ
です。
さらに、プールされた分散は次のように計算されます。
$$s_p^2 = ((n_1-1)s_1^2 + (n_2-1)s_2^2) / (n_1+n_2-2)$$
母平均の差の信頼区間
では、具体的に先程の握力の差について考えてみます。
1.20代と70代男性の握力平均の差を推定したいので、それぞれの群から15人を無作為抽出して平均値と標準偏差を求めます。
20代の握力:
\(x_1\) = 48.11㎏
\(s_1\) = 7.21㎏
\(n_1\) = 15
70代の握力:
\(x_2\) = 36.56㎏
\(s_2\) = 5.93㎏
\(n_2\) = 15
2.2標本の分散をまとめた「プールされた分散(pooled variance)」を求めます。
$$s_p^2 = ((15-1)×7.21^2 + (15-1)×5.93^2) / (15+15-2) = 43.57$$
3.母平均の差の信頼区間を求めます。
t分布において自由度が28のときの上側2.5%点は「2.048407」
t分布において自由度が28のときの上側0.5%点は「2.763262」
Rのqt()関数を使えば簡単です。
基本形:qt(%, df , lower.tail = FALSE)
p:信頼区間の割合(%)
df:自由度(今回は\(n_1+n_2\) -2)
lower.tail:上側を取るので”FALSE”もしくは”F”
qt(.025, df=28, lower.tail = F)
[1] 2.048407
qt(.005, df=28, lower.tail = F)
[1] 2.763262
95%信頼区間
$$(48.11-36.56) ± 2.05×\sqrt{((43.57/15) + (43.57/15))} = [6.6126, 16.4874]$$
99%信頼区間
$$(48.11-36.56) ± 2.76×\sqrt{((43.57/15) + (43.57/15))} =[4.8895, 18.2105]$$
信頼水準が高いほど、信頼区間が広くなることは前回の記事でも書きましたが、信頼区間が広ければ、真の母平均を含む可能性がより高くなりますから、真の母平均を含む割合が高いのは頷けると思います。
母平均の差の信頼区間: 解釈
信頼区間を解釈する方法は、次のとおりである.
地域(〇〇県)在住の20代と70代男性の握力差の95%信頼区間は、6.61~16.48㎏でした。(しかしこの調査で求めた信頼区間が母集団の差を含んでいないリスクも5%の割合で含んでいます。)
母平均の差の信頼区間に「0」が含まれていた場合
母平均の差の信頼区間に値「0」が含まれていた場合、2つの集団の間の平均差に有意性がない可能性があることを意味します。
なぜなら、2つの母平均の真の差が「0」であることが妥当であると考えられるからです。
つまり、2標本を比較する時の一般的な帰無仮説「2つの母平均の間に差はない」という仮説が妥当であるという強い証拠があると言い換えれます。
対応ありデータの場合
上記で示したのは対応なしのデータです。その場合はそれぞれの標本サイズは同じである必要はありませんが、対応ありのデータは当然、標本サイズが同じになりますので計算もかなりシンプルになります。
対応のある2標本の母平均の差の信頼区間の公式:
$$信頼区間 = \bar{x_d} ± t×\sqrt{s^2_d/n}$$
例えば、地域の体操教室に通う70歳代男性を対象に運動プログラムの効果(プログラム実施前と3か月後)を握力測定を使って検討し信頼区間を求めてみます。
以下の表は体操教室からランダムに7人の70代男性のプログラム実施前(baselinet)と3か月後の握力測定をまとめたものです。
このデータから母平均の差の95%信頼区間を求めてみます。
※握力は正規分布していると仮定します
baseline | month_3 | difference |
27.4 | 30.4 | 3.0 |
41.4 | 44.0 | 2.6 |
31.4 | 29.6 | -1.8 |
35.7 | 37.4 | 1.7 |
28.1 | 31.2 | 3.1 |
34.3 | 32.9 | -1.4 |
15.1 | 21.8 | 6.7 |
mean: 30.48 | mean: 32.47 | mean: 2.00 |
1.それぞれのデータ差の平均値と不偏分散を求めます。
今回は2標本の平均の差ですので、差の平均値:2.0、不偏分散:8.46ですね。
2.公式にそれぞれの値を代入していきます。
差の平均値(\(\bar{x_d}\)):2.0
不偏分散(\(s^2_d\)):8.46
サンプルサイズ(n):7
t分布において自由度が6(7-1)のときの上側2.5%点は「2.447」
95%信頼区間
$$(2.0) ± 2.447×\sqrt{((8.46/7)} = [ -0.690, 4.690]$$
となりました。
この場合は「0」を含んでいますので、運動プログラム実施前と3か月後の握力測定結果に差は無いという結論に至りますね。
ちなみに、このデータを対応のあるt検定を実施してみると、
Paired t-test
data: month_3 and baseline
t = 1.8065, df = 6, p-value = 0.1209
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.7039965 4.6754251
sample estimates:
mean of the differences
1.985714
という結果で、P値は0.1209と5%を超えています
まとめ
2標本の平均値の差(母平均の差)の信頼区間についてまとめてみました。データに対応「無し」「有り」もありますが、まずは全体的な信頼区間が把握していただければいいかなと思います。
コメント