の続きです。
今回は調査年度別の健康寿命の値を見てみます。
R言語のgroup_by関数で調査年度別にグループ化してから、summarise関数の中でmean関数で平均値、sd関数で標準偏差、length関数でデータ数、qt関数などで信頼区間を計算しています。
average_mが男性の健康寿命ですが、2010年度は70.4, 2013年度は71.2, 2016年度は72.0と伸びていることがわかります。
average_fが女性の健康寿命です。こちらも73.7, 74.4, 74.9 と年度を経るごとに伸びていますね。
グラフでみてみましょう。
まずは男性の健康寿命です。
geom_errorbar関数とgeom_point関数で信頼区間と平均値の値をグラフにしています。
信頼区間のバーが重なっていませんから、調査年度によって健康寿命の平均値は有意に違うことがわかります。
一応、aov関数とsummary関数で確認しておきます。
p値は2e-16よりも小さいことがわかります。
女性の健康寿命の信頼区間のグラフを描きましょう。
女性も男性と同じように、年度を経るごとに健康寿命が延びていて、信頼区間が重なっていないですね。
こちらもaov関数とsummary関数でANOVA分析をします。
p値が3.22e-12と0.05よりも小さいです。こちらもyearによってfemale: 女性の健康寿命は有意に違うことが確かめられました。
最後に男性と女性の健康寿命の信頼区間のグラフを合わせて描いてみます。
男性と女性の健康寿命の信頼区間は重なっていないですね。男性と女性でも有意に違うことがわかります。
男性の健康寿命の平均値と女性の健康寿命の平均値が有意に違うかどうかをvar.test関数で分散に違いがあるとはいえないことを確認し、t.test関数で検定します。
var.test関数の結果はp-value = 0.6692と0.05よりも大きいので両者の分散に違いがあるとはいえないです。
t.test検定の結果は、p-value < 2.2e-16と0.05よりも大きいので両者の平均値が同じではないことがいえます。
今回は以上です。
次回は、
です。
はじめから読むには、
です。