Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

建設総合統計の分析5 - 増減と地域でクロス表集計(table関数, fisher.test関数)。フィッシャーの直接確率検定

今回は前回に引き続き、建設総合統計でクロス表分析です。

前回は発注者と増減でクロス集計しましたので、今回は地域と増減でクロス集計です。

まずは、

csvファイルに保存してあるデータをread.csv関数で読込み

増減を計算し(ベクトルの引き算)

増減のカテゴリカル変数を作る。(cut関数)

ということをします。

f:id:cross_hyou:20180824153503j:plain

5月は減少が多く、6月は増加が多いです。

早速、地域 x 増減5月カテ でクロス表を作ります。table関数です。

f:id:cross_hyou:20180824153940j:plain

地域ごとの特徴ってあんまりないような印象です。中部が減少6、増加0で目立つくらいでしょうか。。。中部とそれ以外でクロス表を組み直してみます。

f:id:cross_hyou:20180824154454j:plain

中国以外は減少34、増加20で、中国は減少6、増加0です。

今回はカイ自乗検定ではなくて、フィッシャーの直接確率検定をしてみようと思います。fisher.test関数です。

帰無仮説は、中国地方とそれ以外では、減少と増加の比率に差がない、です。

f:id:cross_hyou:20180824154847j:plain

p-value = 0.1653 > 0.05 ですから帰無仮説は棄却されません。

5月の増減は地域によって差があるわけではないようです。

次は、6月です。

f:id:cross_hyou:20180824155302j:plain

あら~~。これは地域による違いは無いですね。。。

一応、近畿と四国と北陸の減少0で増加6の地域とそれ以外の地域でクロス表を作りかえます。

f:id:cross_hyou:20180824155852j:plain

このクロス表をフィッシャーの直接確率検定で検定します。

帰無仮説は、近畿・四国・北陸とそれ以外の地域で、増加・減少の比率は関連が無い、です。

f:id:cross_hyou:20180824160218j:plain

p-value = 0.09106 > 0.05 ですから、帰無仮説は棄却できません。

ということで、地域によって、建設出来高の増減に違いがあるかどうかは、違いが無いという結果になりました。