建設総合統計のデータ分析３ - R言語で２変数のデータ分析の練習。Minkan(民間)とKokyo(公共)を例にして。var.test関数、t.test関数、wilcox.test関数、cor.test関数。

www.crosshyou.info

の続きです。

今回は２変数のデータ分析の練習をしてみます。Minkan(民間)とKokyo(公共)の２変数を例にします。

まずは、boxplot関数で２つ変数の箱ひげ図を見てみます。

f:id:cross_hyou:20200222113421p:plain

f:id:cross_hyou:20200222113435p:plain

Minkan(民間)のほうがvariance, 平均値が大きそうです。

次に、var.test関数で２つの変数のvarianceが同じかどうかを調べてみます。

f:id:cross_hyou:20200222110234p:plain

Minkanのvarianceは8,077,995,287で、Kokyoのvarianceは3,313,504,246です。Minaknのほうが2.5倍くらい大きいですね。variance.testの結果はp値は0.009992と0.05よりも小さいので、帰無仮説を棄却します。つまり二つの変数のvarianceは違う、ということです。

次は、２つの変数の平均値に有意な違いがあるかどうかを、t.test関数で調べます。

f:id:cross_hyou:20200222111422p:plain

Minkan(民間)の平均値は、3648億22百万円。Kokyo(公共)の平均値は、2386億63百万円です。t.testの結果、p値は1.802e-09と0.05よりも小さいので、帰無仮説(２つの平均値は同じ)を棄却します。Minkan(民間)とKokyo(公共)の２つの変数は平均値は違うということです。

wilcox.test関数でも確認します。

f:id:cross_hyou:20200222112241p:plain