の続きです。
前回作成したデータフレームは、
となっていて、平成30年の人数、平成30年の前年比、平成29年の人数、平成29年の前年比と同じ人数のデータ、前年比のデータなのに別々の列になっていました。
これだと分析がやりにくいので、データフレームの形をつくりかえます。
このように、data.frame関数で各年だけのデータフレームを作りました。rep関数で年を作っています。
こうして作ったデータフレームたちをrbind関数で結合します。
str関数で構造を確認します。
うまくできました。
summary関数で各変数のサマリーを見ます。
こちらのほうがスッキリしています。
Yearごとの平均値を見たい場合はtapply関数を使います。
このように簡単に各年ごとの平均値がわかります。
年によって平均値に違いがあるかどうかをaov関数でANOVA分析してみます。
p-valueは0.9997なので年によっての違いはありません。ただしこれは国を考慮に入れていない場合です。
国も説明変数に入れてみます。
年ごとに有意な違いがあります。
国については省略して、モデルのp-valueのところを見ます。
p-value < 2.2e-16と0.05よりも小さいので有意なモデルです。
年をnumericのままにして、ANCOVA分析をします。
年は5.67e-07なので有意です。毎年1005人ずつ増えているようです。
ChgもYearを数値、CountryをファクターにしてANCOVA分析をしてみます。
前年比は年によっての違いはないようです。
今回は以上です。