Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

宗教統計調査データの分析4 - R言語のaov関数とTukeyHSD関数を使ってみる。前回の分析が間違っていたことに気づく。

 

www.crosshyou.info

 の続きです。

前回の分析で、年ごとに都道府県知事所轄団体 / 文部科学大臣所轄団体 の比率は全て同じではなくて、違う年がある、ということがわかりました。

今回は、R言語のaov関数とTukeyHD関数を使って、どの年とどの年に違いがあるかを調べようと思います。

まず、aov関数でANOVAオブジェクトを作成し、TukeyHSD関数を実行します。

f:id:cross_hyou:20190309134133j:plain

 

あれ?エラーになってしまいました。「因子でないものは無視されました」とエラーメッセージがあります。あ、そうですね。Yearは数値型のままでした。as.factor関数で因子(ファクタ)に変換してからもう一回やってみましょう。

f:id:cross_hyou:20190309134758j:plain

うまくいきました。一番右の p adj が p値なので、上の図ではすべて違いがない年の組み合わせですね。あれ?全部1ですね。年ごとの違いは無い、っていうことですね。

前回と違いますね。。oneway.test関数で確認してみます。

f:id:cross_hyou:20190309135502j:plain

p-value = 1 となりました。前回と違うのはなんででしょう?。。。あ、前回はYearを数値型のままで分析していましたね。今回はYearをファクタにしたので年ごとに有意な差は無いという結果になりました。

ねんのため、Yearを数値型にしたYear2という変数を作成してoneway.test関数で分析してみます。

f:id:cross_hyou:20190309140058j:plain

あれ?やっぱりp-value = 1ですね。。

とここまで考えて、前回のコマンドを見たら、なんと、コマンドがhiritsuとTypeのままでした。つまり、年によって比率の違いは無い、ということだったんですね。

前回の分析が間違っていました。

それでは気をとりなおして、宗派でのANOVAオブジェクトでTukeyHSD関数を使ってみます。

f:id:cross_hyou:20190309140747j:plain

p adjがすべての行で0ですから、全てのペアで比率には有意な違いがある、ということです。

plot関数でグラフで表しましょう。

f:id:cross_hyou:20190309141158j:plain

f:id:cross_hyou:20190309141211j:plain

どの組み合わせも0をまたいでいないので、有意な違いだとわかります。

今回は以上です。

最後に今回のR言語のコマンドを記載しておきます。


# aov関数でANOVAオブジェクトを作成し
m <- aov(chida$hiritsu ~ chida$Year)

# TukeyHSD関数を実行
TukeyHSD(m)

# Yearをファクタに変換
chida$Year <- as.factor(chida$Year)

# aov関数
m <- aov(chida$hiritsu ~ chida$Year)

# TukeyHSD関数
TukeyHSD(m)

# oneway.test関数
oneway.test(chida$hiritsu ~ chida$Year)

# 数値型のYear2を作成
Year2 <- as.numeric(chida$Year)

# oneway.test関数
oneway.test(chida$hiritsu ~ Year2)

# Typeでaov関数
tm <- aov(chida$hiritsu ~ chida$Type)

# TukeyHSD関数
TukeyHSD(tm)

# plot関数
plot(TukeyHSD(tm))