crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

就業構造基本調査の分析4 - R言語で仕事者率、家事者率、通学者率を計算する

 

www.crosshyou.info

 の続きです。data_exの変数を改めてみてみます。

f:id:cross_hyou:20181127230142j:plain

変数で、「仕事が主な者」「家事が主な者」「通学が主な者」と~~が主な者という変数があります。これと「総数」を組み合わせて、、仕事が主な者の割合、家事が主な者の割合、通学が主な者の割合を計算してみましょう。

f:id:cross_hyou:20181127231230j:plain

data2という新しいデータを格納する箱を作り、select関数でカテゴリ変数と計算に必要な変数を選択し、mutate関数で新しい変数を作成します。再びselect関数でカテゴリ変数と作成した~~率という変数だけに絞り込むみました。

男女別の平均値を計算してみましょう。group_by関数とsummarise関数ですね。

f:id:cross_hyou:20181127232842j:plain

平均仕事者率と平均通学者率は男性のほうが高く、平均家事者率は女性が高いですね。

続柄別の平均値はどうなるでしょうか?

f:id:cross_hyou:20181127232859j:plain

平均仕事者率がいちばん高いのは世帯主、平均家事者率がいちばん高いのは世帯主の配偶者、平均通学者率がいちばん高いのは未婚です。

年齢別の平均値を出してみましょう。

f:id:cross_hyou:20181127233500j:plain

今回は * 100 を加えてパーセント表示にしてみました。

平均仕事者率が一番高い年齢は30~34歳です。

平均家事者率が一番高い年齢は65~69歳です。

平均通学者率が一番高い年齢は15~19歳です。

今回は以上です。