の続きです。data_exの変数を改めてみてみます。
変数で、「仕事が主な者」「家事が主な者」「通学が主な者」と~~が主な者という変数があります。これと「総数」を組み合わせて、、仕事が主な者の割合、家事が主な者の割合、通学が主な者の割合を計算してみましょう。
data2という新しいデータを格納する箱を作り、select関数でカテゴリ変数と計算に必要な変数を選択し、mutate関数で新しい変数を作成します。再びselect関数でカテゴリ変数と作成した~~率という変数だけに絞り込むみました。
男女別の平均値を計算してみましょう。group_by関数とsummarise関数ですね。
平均仕事者率と平均通学者率は男性のほうが高く、平均家事者率は女性が高いですね。
続柄別の平均値はどうなるでしょうか?
平均仕事者率がいちばん高いのは世帯主、平均家事者率がいちばん高いのは世帯主の配偶者、平均通学者率がいちばん高いのは未婚です。
年齢別の平均値を出してみましょう。
今回は * 100 を加えてパーセント表示にしてみました。
平均仕事者率が一番高い年齢は30~34歳です。
平均家事者率が一番高い年齢は65~69歳です。
平均通学者率が一番高い年齢は15~19歳です。
今回は以上です。