UnsplashのEthan Robertsonが撮影した写真
の続きです。
今回は、県内総生産額との関係を調べてみます。
まず、政府統計の総合窓口から県内総生産額のデータをダウンロードします。
このようなファイルです。これをRにread_csv()関数で読み込みます。
yearの表示が2014年度と年度の表記になっています。これだと土地取得状況等のデータと表記が違うので、度の値を削除します。
str_sub() 関数を使ってみましょう。
次は、inner_join()関数で土地取得状況等のデータフレームと結合します。
このgdpをyear, num_total, area_totalの3つの変数で回帰分析してみましょう。lm()関数で実行できます。
num_totalがプラスの係数で有意、area_totalがマイナスの係数で有意な水準です。
3つの変数を対数に変換して回帰分析してみましょう。
log(num_total)の係数が1.12194で有意です。2007年、2008年、are_totalが変わらないで、num_totalが1%上昇すると、gdpが1.12%上昇する、という解釈です。
gdpとnum_totalの散布図を描いてみます。
log(num_total)が大きいほど、log(gdp)が大きいという散布図ですね。
説明変数をlog(num_total)だけにして回帰分析してみましょう。
係数は1.09なので、ほとんど変わらないですね。lm_gdp2とlm_gdp3で有意な違いがあるのか anova() 関数で確認してみます。
p値が0.1087なので、この2つのモデルには有意な違いは無い、ということです。
今回は以上です。
初めから読むには、
です。