前回に引き続き、クロス表の分析をしようと思います。
2016年度の法人企業統計年報データを使って、製造業/非製造業と売上高経常利益率のクロス表を作成しました。
R言語で作成しました。コマンドは、tableです。
table(Houjin2016$SeHi, Houjin2016$C_Uria_Keiji)
こんな感じで入力します。
なんとなくですが、製造業のほうが、Uria_Keiji_S, つまり売上高経常利益率の低いグループが多いように思います。
独立性を検定します。summaryコマンドで、
summary(table(Houjin2016$SeHi, Houjin2016$C_Uria_Keiji))
とクロス表作成のコマンドを囲うといいです。
結果はこちらです。
p-value = 0.06564 > 0.05 なので、5%水準で棄却できません。
なので、製造業/非製造業と売上高経常利益率は関連があるとは言えません。
続いて、製造業/非製造業と総資本回転率のクロス表を作成します。
tableコマンドで、
table(Houjin$SeHi, Houjin2016$C_Soushi_Kaite)
とします。
結果は下のとおりです。
なんとなく、非製造業のほうが、総資本回転率が低いグループ(Soushi_Kaite_S)の割合が多いように感じます。独立性の検定をしてみましょう。
summary関数で、
summary(table(Houjin2016$SeHi, Houjin2016$C_Soushi_Kaite))
とします。
p-value = 2.095e-06 < 0.005 なので製造業/非製造業と総資本回転率は関係がない、という帰無仮説は棄却されます。つまり、製造業/非製造業と総資本回転率は関係があるということです。
どの組み合わせが有意にさせているのか、調整残差を計算してみましょう。
まず、クロス表を、crosshyouという変数に格納します。
crosshyou <- table(Houjin2016$SeHi, Houjin2016$C_Soushi_Kaite)
そして、crosshyouをchisq.testを実行して、その結果を、ressults という変数に格納します。
調整残差は、results$stdresで表示されます。
調整済み残差は±2以上のものが有意にさせている組み合わせということです。
プラスのところに注目すると、製造業は総資産回転率が中位のグループ(Soushi_Kaite_M)が多く、非製造業は総資産回転率が低位のグループ(Soushi_Kaite_S)が多い、ということがわかりました。