www.crosshyou.infoの続きです。
前回でデータを整理整頓しましたが、やり残していましたので、もう少しやります。
eiyousoのところの【人】や【kcal】を独立させて、unitというコラム名にしようと思います。
separate関数で【で二つに分けたあと、str_remove関数で】を削除しました。
表示してみます。
うまくいきました。
eiyousoにはどんな種類があるのか、table関数でみてみます。
エネルギーをはじめとして各種ビタミンや脂肪酸、食物繊維、炭水化物、たんぱく質などがありました。
regionにはどのような区分があるかを見てみます。
関東は1と2、近畿も1と2、九州は北九州と南九州にわかれています。
yearもみてみましょう。
2012年から2017年まで6年間ですね。2012年と2013年はデータ数が少し少ないです。
typeの種類を確認します。
実数は調査人数のことです。
エネルギーの平均値の年ごとの推移を地域ブロック別にグラフにしてみます。
グラフの線が入り組んでいますね。地域ブロック別に明確な区別はなさそうです。
group_by関数とsummarise関数で地域ブロック別にエネルギーの平均値を算出してみます。
全国平均は1877kcalで、近畿2が1912kcalで一番摂取カロリーは高いです。
北海道が1825kcalで一番低いです。北海道はたべもの美味しいイメージですが、摂取カロリーは少ないのですね。
地域ブロック別に摂取エネルギーに違いがあるといえるのか、ANOVA分析をしてみます。aov関数でANOVAのモデルを作って、anova関数で結果を表示します。
p値は0.0004296なので地域ブロック別に摂取エネルギーに違いはありそうです。
TukeyHSD関数でどの地域とどの地域に違いがあるかを見てみます。
南九州と近畿2、北海道と近畿2の2組が有意に違うことがわかりました。
今回は以上です。
次回は
です。
はじめから読むには、
です。