Bing Image Creator で生成: 青い空に白い雲が3つあって、虹がかかっている。パンジーの花がたくさん咲いている、写真
の続きです。
前回は輸送量の増えた地域、減った地域を調べてみました。
今回は、この増減が人口と関わりがあるのかを調べてみようと思います。
そこで、政府統計の総合窓口(www.e-stat.go.jp)から都道府県別の人口のデータをダウロードしました。
これを R に読み込みます。
この df_population から2000年度と2022年度だけのデータにして、変化率も計算します。
まず、filter() 関数で2022年度と2020年度だけにします。
pivot_wider() 関数で縦持ち型のデータフレームを横持ち型のデータフレームに変換します。この pivot_wider() 関数や、その反対の pivot_longer() 関数、いつまでたっても使い方が覚えられません。
rename() 関数で変数名を変更しました。
mutate() 関数で2022年度と2020年度の変化率(正確は変化倍数)を計算しました、これを df_2020_2022 と合体させます。
df_2020_2022 には北海道はなくて、札幌、旭川などだったので、合体したデータフレームは、46都府県のデータフレームになります。
general_num_chg を被説明変数にして、Y2020 と pop_chg を被説明変数にして回帰分析をします。lm() 関数を使います。
summary() 関数で結果をみてみます。
p-value は Y2020 は0.974, pop_chg は 0.890 と有意な関係性は見られないですね。
散布図でもこのことを確認してみましょう。
どちらの散布図も Y2020, pop_chg と general_num_chg は関係が無さそうな散布図になりました。
今回は以上です。
次回は、
です。
初めから読むには、
です。