Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の食品営業施設処分件数のデータの分析5 - R言語で単回帰分析と多項式線形回帰分析をする

 

www.crosshyou.info

 の続きです。

今回はR言語のlm関数を使って、単回帰分析と多項式線形回帰分析をしてみます。

まずは、変数同士の散布図をみてみます。

f:id:cross_hyou:20210515124012p:plain

f:id:cross_hyou:20210515124028p:plain

相関係数マトリックスもみてみます。

f:id:cross_hyou:20210515124152p:plain

per_shobun: 食品営業施設当たりの処分件数と一番相関の強いのはshishutsu: 消費支出(全世帯)(円)ですね。per_shobunをshishutsuで回帰分析してみます。lm関数を使います。

f:id:cross_hyou:20210515124424p:plain

p-value < 2.2e-16ということなので有意なモデルです。shishutsuが大きい値ほど、per_shobunは小さな値になります。

残差プロットを見てみます。

f:id:cross_hyou:20210515124656p:plain

f:id:cross_hyou:20210515124711p:plain

残差の散らばりぐあいが右側にいくほど大きくなっています。これはこの統計モデルはよくないということですね。

per_shishutsuとshishitsuの散布図に回帰直線を重ねてみましょう。

f:id:cross_hyou:20210515124952p:plain

f:id:cross_hyou:20210515125007p:plain

続いて、多項式回帰分析をしてみます。poly()という関数で多項式を作れます。

f:id:cross_hyou:20210515125311p:plain

p-value < 2.2e-16なので有意なモデルです。単回帰分析のR-squareは0.1653でしたがこちらは0.1832と数値が大きくなっていますのであてはまりが改善しています。

残差プロットを見てみます。

f:id:cross_hyou:20210515125656p:plain

f:id:cross_hyou:20210515125713p:plain

散布図と回帰直線を重ねてみます。

f:id:cross_hyou:20210515130341p:plain

f:id:cross_hyou:20210515130356p:plain

散布図のY軸の範囲を0~5にして描いてみます。

f:id:cross_hyou:20210515130847p:plain

f:id:cross_hyou:20210515130903p:plain

多項式回帰のほうは曲線になっていることがよくわかります。
今回は以上です。

次回は

 

www.crosshyou.info

 です。

はじめから読むには

 

www.crosshyou.info

 です。