crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

地域ブロック別の栄養素等摂取量のデータの分析2 - 北海道が一番摂取カロリーは低い。

 

www.crosshyou.infoの続きです。

前回でデータを整理整頓しましたが、やり残していましたので、もう少しやります。

f:id:cross_hyou:20210101125148p:plain

eiyousoのところの【人】や【kcal】を独立させて、unitというコラム名にしようと思います。

f:id:cross_hyou:20210101125710p:plain

separate関数で【で二つに分けたあと、str_remove関数で】を削除しました。

表示してみます。

f:id:cross_hyou:20210101125920p:plain

うまくいきました。

eiyousoにはどんな種類があるのか、table関数でみてみます。

f:id:cross_hyou:20210101131711p:plain

エネルギーをはじめとして各種ビタミンや脂肪酸、食物繊維、炭水化物、たんぱく質などがありました。

regionにはどのような区分があるかを見てみます。

f:id:cross_hyou:20210101132004p:plain

関東は1と2、近畿も1と2、九州は北九州と南九州にわかれています。

yearもみてみましょう。

f:id:cross_hyou:20210101132200p:plain

2012年から2017年まで6年間ですね。2012年と2013年はデータ数が少し少ないです。

typeの種類を確認します。

f:id:cross_hyou:20210101132359p:plain

実数は調査人数のことです。

エネルギーの平均値の年ごとの推移を地域ブロック別にグラフにしてみます。

f:id:cross_hyou:20210101133018p:plain

f:id:cross_hyou:20210101133033p:plain

グラフの線が入り組んでいますね。地域ブロック別に明確な区別はなさそうです。

group_by関数とsummarise関数で地域ブロック別にエネルギーの平均値を算出してみます。

f:id:cross_hyou:20210101133553p:plain

全国平均は1877kcalで、近畿2が1912kcalで一番摂取カロリーは高いです。

北海道が1825kcalで一番低いです。北海道はたべもの美味しいイメージですが、摂取カロリーは少ないのですね。

地域ブロック別に摂取エネルギーに違いがあるといえるのか、ANOVA分析をしてみます。aov関数でANOVAのモデルを作って、anova関数で結果を表示します。

f:id:cross_hyou:20210101135029p:plain

p値は0.0004296なので地域ブロック別に摂取エネルギーに違いはありそうです。

TukeyHSD関数でどの地域とどの地域に違いがあるかを見てみます。

f:id:cross_hyou:20210101135731p:plain

f:id:cross_hyou:20210101140003p:plain

f:id:cross_hyou:20210101140106p:plain

南九州と近畿2、北海道と近畿2の2組が有意に違うことがわかりました。

今回は以上です。

 次回は

 

www.crosshyou.info

 です。

 

はじめから読むには、

 

www.crosshyou.info

 です。