R basic

分析上手のコツ!Rのreshape(melt,cast) でデータを簡単に加工・整形

集めたデータはRaw dataと呼ばれ、このRaw dataを整形(データクレンジング)・加工することが分析の第一歩といっても過言ではありません。 そこで、今回はRのreshapeパッケージを取り上げます。 reshapeパッケージとは r...
医学統計学

統計初心者でも簡単!二項分布とR関数:dbinom, pbinom, qbinom, rbinomについて

今回は「成功か失敗」、「有る・無し」の確率を扱う二項分布について統計初心者の方でも簡単に理解できるようにまとめます! ベルヌーイ試行 まず二項分布を理解するために必要な、ベルヌーイ試行から始めます。ベルヌーイ試行は、「成功か失敗」、「有る・...
R programming

R初心者でも簡単!複数のグラフを表示・結合する方法:par, layout, mfrow, mfcol

Rでデータ分析をした後、視覚的なツールとしてグラフを作成しますね。通常はグラフは1つ1つ表示されますが、複数のグラフを比較した時は各グラフWindowをデスクトップ上に並べたいですね。 今回は、複数のグラフを表示させる方法を2つ紹介します。...
医学統計学

R初心者でもOK! 単回帰分析とlm関数を分かりやすく説明します

単回帰分析とは 単回帰分析は、2つの変数間の関係を要約して調べることができる統計手法です。このとき、 x軸:予測変数・説明変数・独立変数 y軸:応答変数・結果変数・従属変数 と呼ばれます。 今回の説明では、xを「予測変数」、yを「応答変数」...
医学統計学

統計初心者でもOK!Rを使ったリスク比とオッズ比を簡単に説明します!

はじめに 量的(カテゴリー)データを対象とした研究論文では、アウトカム効果を示す尺度にオッズ比(OR)やリスク比(=相対リスク:RR)を用いています。 でも、オッズ比やリスク比はよく耳にしますが、しっかりと理解されていないことが多いので、今...
医学統計学

統計初心者でも分かる:割合(比率)の信頼区間と割合(比率)の差の信頼区間

以前の記事で信頼区間については触れましたが、信頼区間とはある信頼度で母集団のパラメータを含むと思われる範囲の事でした。 今回は、割合(比率)の信頼区間、つまり、 「ある信頼度で母集団の割合を含むと思われる値の範囲」 についてまとめていきます...
医学統計学

2標本平均の差(母集団の平均の差など)の信頼区間

前回は信頼区間についての基本と1標本の母平均の信頼区間についてまとめました。 しかし、研究や調査では2標本を比較対象とすることが一般的ですね。そこで、今回は、母平均間の差の信頼区間(つまり「真の差」を、ある信頼度で含むと思われる範囲)につい...
基本統計学

信頼区間について簡単に基本をまとめてみました(具体例あり)

統計学における重要な概念である「信頼区間」に焦点を当てています。母集団の特性を推測するために標本データを使用する際に生じる不確実性に対処する手段として、信頼区間がどのように計算され、解釈されるかを詳しく解説しています。医療統計の視点からもアプローチし、信頼区間がP値と比べて提供する情報の豊富さについて考察しています。また、信頼区間の正しい解釈や注意点、大きさに影響を与える要素にも触れ、統計データを理解し、適切に活用できることをお手伝いします。
基本統計学

Rで簡単!散布図の作成方法と色分けや数字表示などの応用も解説(ggplot2も使います)

散布図とは? 散布図とは、2つの異なる変数の値を点で表したグラフです。x軸とy軸の各点の位置は、個々のデータポイントの値を示しています。 例えば、上の散布図では架空のデータですが、この散布図から、x軸変数とy軸変数の間には、概して強い正の相...
R basic

data.frameに新しい列を追加する方法:$演算子、[]角括弧、cbind

研究や調査でデータをデータフレームやmatrix(行列)形式で取り込んだ後に、新たに列を追加する機会は多いと思います。そこで今回は、Rプログラミングでデータフレームに新しい列を追加する方法をまとめました。 サンプルデータの作成 まずはベース...