Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

消費動向調査のデータ分析9 - 仕事を探しているか、探していないかで暮らし向きに違いがあるかどうか?

 

www.crosshyou.info

 の続きです。

今回は、仕事を探しているか、探していないかで暮らし向きに違いがあるかどうかをR言語を使って調べます。

始めに必要な表を抽出します。データフレームのsubscriptsのテクニックを使います。

f:id:cross_hyou:20200415135753j:plain

この表から分析用のマトリックスを作ります。今回はmatrix関数の中身を計算式で作りました。rownames関数で行の名前、colnames関数で列の名前を定義します。

f:id:cross_hyou:20200415135829j:plain

割合で表示してみましょう。rowSums関数で行ごとの合計値が計算できますので、それを利用します。

f:id:cross_hyou:20200415135858j:plain

仕事を探しているほうがGoodもBadも多いです。意見がはっきりしていますね。

グラフにしてみます。barplot関数を使いました。

f:id:cross_hyou:20200415135953j:plain

f:id:cross_hyou:20200415140005j:plain

カイ2乗検定で仕事を探しているか探していないかで暮らし向きに有意な差があるか検定します。chisq.test関数を使います。

f:id:cross_hyou:20200415140108j:plain

p-value = 4.907e-05と0.05よりも小さいですから、有意ですね。

残差調整済みマトリックスを表示します。cisq.test関数で作ったオブジェクトに$stdresを付けて表示します。

f:id:cross_hyou:20200415140204j:plain

仕事を探している人がいる世帯は、GoodとBadが有意に多く、Sameが有意に少ないことがわかりました。仕事を探している人がいない世帯はその逆です。

今回は以上です。
これで消費動向調査のデータ分析は終了です。