www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の工業用水量のデータの分析6 - R言語のbroomパッケージのtidy()関数で効率よくlm()関数で回帰分析をする。

f:id:cross_hyou:20211113075419j:plain

Photo by Markus Spiske on Unsplash 

www.crosshyou.info

の続きです。

今回もR言語のlm()関数で回帰分析をしていこうと思います。今回はbroomパッケージのtidy()関数を使ってみます。

まずは、broomパッケージを読み込みます。

f:id:cross_hyou:20211113075950p:plain

broomパッケージのtidy()関数は、lm()関数での結果をデータフレームに変換してきれいに出力してくれます。例えば、前回作成したモデルでやってみましょう。

f:id:cross_hyou:20211113080142p:plain

このように信頼区間も表示してくれます。

それでは、このtidy()関数を利用して、2014年だけのデータの他に他の調査年のデータも一度にlm()関数で回帰分析してみます。

f:id:cross_hyou:20211113080456p:plain

まずは切片、(Intercept)だけを表示してみました。信頼区間がどの調査年も0を含んでいます。つまり、H0: (Intercept) = 0 という帰無仮説を棄却できないということですね。

次は、l_kachi: 製造業付加価値額の対数変換値の係数をみてみます。

f:id:cross_hyou:20211113080834p:plain

どの調査年も1.1前後の係数で、H0: l_kachi = 0 という帰無仮説を棄却できますね。

グラフにしてみます。

f:id:cross_hyou:20211113082151p:plain

f:id:cross_hyou:20211113082204p:plain

geom_errorbar()関数で信頼区間をグラフにできます。どの調査年も同じくらいの係数であることがわかります。

nosea: 海が無い県は1, 海がある県は0のダミー変数 についても係数を見てみましょう。

f:id:cross_hyou:20211113082432p:plain

係数が-1.5前後でどの調査年も信頼区間は0を含んでいませんね。

H0: nosea = 0 という帰無仮説を棄却して、H1: nosea < 0 という対立仮説を採用できます。

これもグラフにします。

f:id:cross_hyou:20211113083035p:plain

f:id:cross_hyou:20211113083048p:plain

なんだか少しずつ低下している感じですね。

l_water = Intercept + b1*l_kachi + b2*nosea + b3*year というyearを含めたモデルを調べてみましょう。

f:id:cross_hyou:20211113083827p:plain

yearをファクター型にして回帰分析してみました。yearの信頼区間はすべて0を含んでいますので、yearは有意な変数ではないということですね。

今回は以上です。

次回は

 

www.crosshyou.info

です。

 

初めから読むには、

 

www.crosshyou.info

です。