2022-05

医学統計学

2標本平均の差(母集団の平均の差など)の信頼区間

前回は信頼区間についての基本と1標本の母平均の信頼区間についてまとめました。 しかし、研究や調査では2標本を比較対象とすることが一般的ですね。そこで、今回は、母平均間の差の信頼区間(つまり「真の差」を、ある信頼度で含むと思われる範囲)につい...
基本統計学

信頼区間について簡単に基本をまとめてみました(具体例あり)

統計学における重要な概念である「信頼区間」に焦点を当てています。母集団の特性を推測するために標本データを使用する際に生じる不確実性に対処する手段として、信頼区間がどのように計算され、解釈されるかを詳しく解説しています。医療統計の視点からもアプローチし、信頼区間がP値と比べて提供する情報の豊富さについて考察しています。また、信頼区間の正しい解釈や注意点、大きさに影響を与える要素にも触れ、統計データを理解し、適切に活用できることをお手伝いします。
基本統計学

Rで簡単!散布図の作成方法と色分けや数字表示などの応用も解説(ggplot2も使います)

散布図とは? 散布図とは、2つの異なる変数の値を点で表したグラフです。x軸とy軸の各点の位置は、個々のデータポイントの値を示しています。 例えば、上の散布図では架空のデータですが、この散布図から、x軸変数とy軸変数の間には、概して強い正の相...
R basic

data.frameに新しい列を追加する方法:$演算子、[]角括弧、cbind

研究や調査でデータをデータフレームやmatrix(行列)形式で取り込んだ後に、新たに列を追加する機会は多いと思います。そこで今回は、Rプログラミングでデータフレームに新しい列を追加する方法をまとめました。 サンプルデータの作成 まずはベース...
医学統計学

やってみると簡単!四分位範囲と箱ひげ図~Rを使うともっと簡単ですよ~

四分位範囲(IQR: interquartile range) 四分位範囲は、集めたデータ内の「中間の50%」がどこにあるかを示す範囲をいいます。つまり四分位範囲は、値の中央集団がどこにあるかを示す指標ということができます。 四分位範囲は、...
医学統計学

様々な平均値:加重平均、幾何平均、調和平均、トリム平均、移動平均

平均値と言えは、集めたデータを全て足した合計をデータ数で割る、 $$\frac{(x_1 +x_2 + ... +x_n)}{n}$$ を思い浮かべますね。 この平均値は算術平均と呼ばれます。 統計学ではさらにノンパラメトリックやカテゴリー...
基本統計学

ヒストグラムを把握する5ポイントとRでの簡単な作成方法

ヒストグラムとは度数分布表のデータ(x軸は階級、y軸は度数)を基に作成されるグラフです。※度数分布表の作り方については以下を参照して下さい。 ヒストグラムから得られる5つの情報 1. データのピークがいくつあるのか:単峰性?多峰性? 2. ...
基本統計学

5Stepで簡単!度数分布表の作り方と「R」をちょっと応用した方法も紹介します

データを収集したら、まずはデータを視覚的に整理する必要があります。その際、度数分布表はとても役立つ整理方法の一つですね。でも、度数分布表って「どうやって作るの?」「データは適当に区切って作るの?」「もしくは作り方のガイドライン的なものはある...
医学統計学

【10分あればOK】Rを使って信頼区間を求める方法

推定値の信頼性? 統計学を使って推定した値は実際どれだけの信頼性があるのでしょうか? 確率・統計の分野では、「大数の法則」や「中心極限定理」により、標本サイズが大きければ、 標本平均は母平均に近づく 標本平均の分布は、平均\(\mu\)、標...