Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の自動車(バス)輸送統計調査のデータ分析5 - 人口の増減で回帰分析

Bing Image Creator で生成: 青い空に白い雲が3つあって、虹がかかっている。パンジーの花がたくさん咲いている、写真

 

www.crosshyou.info

の続きです。

前回は輸送量の増えた地域、減った地域を調べてみました。

今回は、この増減が人口と関わりがあるのかを調べてみようと思います。

そこで、政府統計の総合窓口(www.e-stat.go.jp)から都道府県別の人口のデータをダウロードしました。

これを R に読み込みます。

この df_population から2000年度と2022年度だけのデータにして、変化率も計算します。

まず、filter() 関数で2022年度と2020年度だけにします。

pivot_wider() 関数で縦持ち型のデータフレームを横持ち型のデータフレームに変換します。この pivot_wider() 関数や、その反対の pivot_longer() 関数、いつまでたっても使い方が覚えられません。

rename() 関数で変数名を変更しました。

mutate() 関数で2022年度と2020年度の変化率(正確は変化倍数)を計算しました、これを df_2020_2022 と合体させます。

df_2020_2022 には北海道はなくて、札幌、旭川などだったので、合体したデータフレームは、46都府県のデータフレームになります。

general_num_chg を被説明変数にして、Y2020 と pop_chg を被説明変数にして回帰分析をします。lm() 関数を使います。

summary() 関数で結果をみてみます。

p-value は Y2020 は0.974, pop_chg は 0.890 と有意な関係性は見られないですね。

散布図でもこのことを確認してみましょう。

どちらの散布図も Y2020, pop_chg と general_num_chg は関係が無さそうな散布図になりました。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

初めから読むには、

www.crosshyou.info

です。