Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の企業の土地取得状況等に関する調査のデータ分析7 - 県内総生産額との関係を回帰分析でみてみる

UnsplashEthan Robertsonが撮影した写真 

www.crosshyou.info

の続きです。

今回は、県内総生産額との関係を調べてみます。

まず、政府統計の総合窓口から県内総生産額のデータをダウンロードします。

このようなファイルです。これをRにread_csv()関数で読み込みます。

yearの表示が2014年度と年度の表記になっています。これだと土地取得状況等のデータと表記が違うので、度の値を削除します。

str_sub() 関数を使ってみましょう。

次は、inner_join()関数で土地取得状況等のデータフレームと結合します。

このgdpをyear, num_total, area_totalの3つの変数で回帰分析してみましょう。lm()関数で実行できます。

num_totalがプラスの係数で有意、area_totalがマイナスの係数で有意な水準です。

3つの変数を対数に変換して回帰分析してみましょう。

log(num_total)の係数が1.12194で有意です。2007年、2008年、are_totalが変わらないで、num_totalが1%上昇すると、gdpが1.12%上昇する、という解釈です。

gdpとnum_totalの散布図を描いてみます。

log(num_total)が大きいほど、log(gdp)が大きいという散布図ですね。

説明変数をlog(num_total)だけにして回帰分析してみましょう。

係数は1.09なので、ほとんど変わらないですね。lm_gdp2とlm_gdp3で有意な違いがあるのか anova() 関数で確認してみます。

p値が0.1087なので、この2つのモデルには有意な違いは無い、ということです。

今回は以上です。

初めから読むには、

www.crosshyou.info

です。