Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別のジニ係数の分析6 - R言語のlm関数で回帰分析

 

www.crosshyou.info

 の続きです。

今回はR言語のlm関数で回帰分析をしてみます。

2014年のincome(二人以上の世帯の年間収入のジニ係数)を、2009年のジニ係数で回帰分析してみます。

はじめに2014年のincome, 2009年のincomeのベクトルを作ります。

%>%処理と.$

income2014とincome2009の散布図を描いてみましょう。

geom_point関数で散布図

散布図

普通にplot(income2009, income2014)で散布図は描けますが、今回はggplot2のgeom_point関数で散布図を作成してみました。あんまり相関関係は無いようですね。

cor.test関数で相関係数を確認してみます。

cor.test関数

p-value = 0.1062と0.05よりも大きいので相関関係があるとは言えないです。

まあ、とりあえず、lm関数で回帰分析モデルを作成してみます。

lm関数で回帰分析

p-value : 0.1062 とcor.test関数と同じp値です。回帰分析モデルも有意とは言えない、ということですね。

説明変数に2009年のsaving(二人以上の世帯の貯蓄現在高のジニ係数)も加えてみましょう。

まず、2009年のsavingのベクトルを作ります。

%>%処理と.$

こうして作成したsaving2009も説明変数に加えた回帰モデルを作りましょう。

lm関数で回帰分析

p-value: 0.2633 と0.05よりも大きいですから、このモデルも有意なモデルではないですね。

つまり、2014年度の二人以上の年間収入のジニ係数は、2009年度の二人以上の年間収入のジニ係数と現在貯蓄現在高のジニ係数では説明できないということですね。

最後にincome2014, income2009, saving2009の散布図マトリックスを描きましょう。

pairs関数を使います。

pairs関数

散布図マトリックス

今回は以上です。