www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の被服及び履物費のデータの分析3 - R言語で回帰分析。まずは単回帰分析。15~64歳の人口割合を説明変数にする。

UnsplashBoris Smokrovicが撮影した写真 

www.crosshyou.info

の続きです。

今回はR言語で回帰分析をしてみます。

被説明変数は、wear_shoe: 被服及び履物費です。回帰分析をはじめる前にwear_shoeとその他の説明変数の候補との相関関係を確認しておきましょう。

一番相関係数が大きいのは、percapita23: 一人当たりの県民所得(平成23年基準)ですね。

これらの散布図も描いてみます。

まずは、上のようにそれぞれの散布図をオブジェクトとして保存しておきます。

そして、gridExtraパッケージのgrid.arrange()関数をつかって9つの散布図を同時に表示します。

こうやって散布図にすると、wear_shoeとの関係性がよくわかりますね。

wariai: 15~64歳の人口割合、を説明変数にして回帰分析してみます。説明変数が一つなので、単回帰分析です。

lm()関数で回帰分析のオブジェクトを作ります。

回帰分析の結果を見るのに、通常はsummary()関数を使いますが、今回はmoderndiveパッケージのget_regression_table()関数を使います。

式で表すと、

wear_shoe = -3283 + 264 * wariai + u

となります。wariaiが1増えると264だけwear_shoeが増えるという式です。

wear_shoeとwariaiの散布図に回帰直線と重ねてみます。

geom_abline()関数で直線を引きました。

lm_wariai$coefficient[1] で切片、lm_wariai$coefficient[2]で傾きを取り出せます。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

はじめから読むには、

www.crosshyou.info

です。