www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の趣味・娯楽の平均時間のデータ分析2 - R言語で2変数の分散と分布位置を比較する。var.test関数とwilcox.test関数

 

www.crosshyou.info

 の続きです。

前回の分析で男性のほうが趣味・娯楽の平均時間が長い、無業者のほうが有業者よりも趣味娯楽の平均時間が長い、という傾向にあることがわかりました。

今回は、このことを統計検定してみましょう。2つの平均値に差があるかどうかという検定ですね。

まずは、男性のデータ、女性のデータをまとめたベクトルを作ります。

f:id:cross_hyou:20200304194649p:plain

有業者と無業者合わせた男性の趣味・娯楽時間の平均値は、57.86分です。

f:id:cross_hyou:20200304194757p:plain

女性のほうは平均時間は35.35分とやっぱり低いですね。

boxplot関数で箱ひげ図を描いて、MaleとFemaleを比較しましょう。

f:id:cross_hyou:20200304194951p:plain

f:id:cross_hyou:20200304195004p:plain
箱ひげ図を見ると、明らかに男性のほうが趣味・娯楽の時間が長いですね。

 

ここからは、

Statistics: An Introduction Using R

Statistics: An Introduction Using R

 

 こちらの本、Statistics: An Introduction Using R の本を参考にして分析します。

まずは、分散の比較です。var.test関数を使います。

f:id:cross_hyou:20200304195116p:plain

p値が2.2e-16と0.05よりも小さいので、MaleとFemaleでは分散は有意に違います。

分散が両者で違うので、Wilcoxon rank-sum testで両者の分布位置の違いを検定します。wilcox.test関数です。

f:id:cross_hyou:20200304195352p:plain

p値は2.2e-16よりも小さいですから、MaleとFemaleは有意に分布の位置が違うということです。MaleとFemale, 男性と女性では有意に趣味・娯楽の時間が違います。

同じようにして、有業者と無業者でも比較してみます。

f:id:cross_hyou:20200304195523p:plain

有業者の趣味・娯楽時間の平均値は34.01分、無業者のほうは59.21分ですから、無業者のほうが長いようです。

boxplot関数で分布を比べてみます。

f:id:cross_hyou:20200304195909p:plain

f:id:cross_hyou:20200304195921p:plain

無業者のほうが長いですね。

var.test関数で分散、varianceを比較します。

f:id:cross_hyou:20200304200104p:plain

p値が2.2e-16よりも小さいので、有業者と無業者の分散は有意に違います。

wilcox.test関数でWilcoxon rank-sum testを実行します。

f:id:cross_hyou:20200304200359p:plain

p値が2.2e-16よりも小さいので、有業者と無業者の趣味娯楽時間の長さは有意に違うことがわかりました。

今回は以上です。