今回は前回に引き続き、建設総合統計でクロス表分析です。
前回は発注者と増減でクロス集計しましたので、今回は地域と増減でクロス集計です。
まずは、
csvファイルに保存してあるデータをread.csv関数で読込み
増減を計算し(ベクトルの引き算)
増減のカテゴリカル変数を作る。(cut関数)
ということをします。
5月は減少が多く、6月は増加が多いです。
早速、地域 x 増減5月カテ でクロス表を作ります。table関数です。
地域ごとの特徴ってあんまりないような印象です。中部が減少6、増加0で目立つくらいでしょうか。。。中部とそれ以外でクロス表を組み直してみます。
中国以外は減少34、増加20で、中国は減少6、増加0です。
今回はカイ自乗検定ではなくて、フィッシャーの直接確率検定をしてみようと思います。fisher.test関数です。
帰無仮説は、中国地方とそれ以外では、減少と増加の比率に差がない、です。
p-value = 0.1653 > 0.05 ですから帰無仮説は棄却されません。
5月の増減は地域によって差があるわけではないようです。
次は、6月です。
あら~~。これは地域による違いは無いですね。。。
一応、近畿と四国と北陸の減少0で増加6の地域とそれ以外の地域でクロス表を作りかえます。
このクロス表をフィッシャーの直接確率検定で検定します。
帰無仮説は、近畿・四国・北陸とそれ以外の地域で、増加・減少の比率は関連が無い、です。
p-value = 0.09106 > 0.05 ですから、帰無仮説は棄却できません。
ということで、地域によって、建設出来高の増減に違いがあるかどうかは、違いが無いという結果になりました。