R programming

R初心者でも簡単!複数のグラフを表示・結合する方法:par, layout, mfrow, mfcol

Rでデータ分析をした後、視覚的なツールとしてグラフを作成しますね。通常はグラフは1つ1つ表示されますが、複数のグラフを比較した時は各グラフWindowをデスクトップ上に並べたいですね。今回は、複数のグラフを表示させる方法を2つ紹介します。複...
医学統計学

R初心者でもOK! 単回帰分析とlm関数を分かりやすく説明します

単回帰分析とは単回帰分析は、2つの変数間の関係を要約して調べることができる統計手法です。このとき、x軸:予測変数・説明変数・独立変数y軸:応答変数・結果変数・従属変数と呼ばれます。今回の説明では、xを「予測変数」、yを「応答変数」とします。...
医学統計学

統計初心者でもOK!Rを使ったリスク比とオッズ比を簡単に説明します!

はじめに量的(カテゴリー)データを対象とした研究論文では、アウトカム効果を示す尺度にオッズ比(OR)やリスク比(=相対リスク:RR)を用いています。でも、オッズ比やリスク比はよく耳にしますが、しっかりと理解されていないことが多いので、今回は...
医学統計学

統計初心者でも分かる:割合(比率)の信頼区間と割合(比率)の差の信頼区間

以前の記事で信頼区間については触れましたが、信頼区間とはある信頼度で母集団のパラメータを含むと思われる範囲の事でした。今回は、割合(比率)の信頼区間、つまり、「ある信頼度で母集団の割合を含むと思われる値の範囲」についてまとめていきます。割合...
医学統計学

2標本平均の差(母集団の平均の差など)の信頼区間

前回は信頼区間についての基本と1標本の母平均の信頼区間についてまとめました。しかし、研究や調査では2標本を比較対象とすることが一般的ですね。そこで、今回は、母平均間の差の信頼区間(つまり「真の差」を、ある信頼度で含むと思われる範囲)について...
基本統計学

信頼区間について簡単に基本をまとめてみました(具体例あり)

統計学における重要な概念である「信頼区間」に焦点を当てています。母集団の特性を推測するために標本データを使用する際に生じる不確実性に対処する手段として、信頼区間がどのように計算され、解釈されるかを詳しく解説しています。医療統計の視点からもアプローチし、信頼区間がP値と比べて提供する情報の豊富さについて考察しています。また、信頼区間の正しい解釈や注意点、大きさに影響を与える要素にも触れ、統計データを理解し、適切に活用できることをお手伝いします。
基本統計学

Rで簡単!散布図の作成方法と色分けや数字表示などの応用も解説(ggplot2も使います)

散布図とは?散布図とは、2つの異なる変数の値を点で表したグラフです。x軸とy軸の各点の位置は、個々のデータポイントの値を示しています。例えば、上の散布図では架空のデータですが、この散布図から、x軸変数とy軸変数の間には、概して強い正の相関が...
R basic

data.frameに新しい列を追加する方法:$演算子、[]角括弧、cbind

研究や調査でデータをデータフレームやmatrix(行列)形式で取り込んだ後に、新たに列を追加する機会は多いと思います。そこで今回は、Rプログラミングでデータフレームに新しい列を追加する方法をまとめました。サンプルデータの作成まずはベースにな...
医学統計学

やってみると簡単!四分位範囲と箱ひげ図~Rを使うともっと簡単ですよ~

四分位範囲(IQR: interquartile range)四分位範囲は、集めたデータ内の「中間の50%」がどこにあるかを示す範囲をいいます。つまり四分位範囲は、値の中央集団がどこにあるかを示す指標ということができます。四分位範囲は、小さ...
医学統計学

様々な平均値:加重平均、幾何平均、調和平均、トリム平均、移動平均

平均値と言えは、集めたデータを全て足した合計をデータ数で割る、$$\frac{(x_1 +x_2 + ... +x_n)}{n}$$を思い浮かべますね。この平均値は算術平均と呼ばれます。統計学ではさらにノンパラメトリックやカテゴリーデータ等...