www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別のパソコン所有数量のデータ分析3 - Rのlm()関数で回帰分析。所得や大学・大学院卒者の割合、趣味・娯楽の時間が大きいほど、パソコン所有数量も大きい。

Generated by Bing Inage Creator: flower of Lysichiton camtschatcensis schott, photo

www.crosshyou.info

の続きです。今回は回帰分析でパソコン所有数量が1人当たり県民所得などの変数と関連があるかを調べてみます。

まず、前回と同じように各変数の調査年が一致していないので、平均値のデータフレームを作成します。

各変数間の相関係数をみてみます。

pc_meanを被説明変数、その他を説明変数にして回帰分析をしようと思いますが、雪面変数どうしで一番相関があるのは、一人当り県民所得と大学・大学院卒者の割合で、0.701です。このぐらいの相関ならば、多重共線性の影響は大きくはないでしょう。

lm()関数で回帰分析をしてみます。

summary()関数で結果をみてみます。

所得、大学・大学院卒者の割合、趣味・娯楽の時間が増加するとパソコン所有数量が増加する、という結果です。

shotoku_meanの係数は、0.06125なので、1人当たり県民所得が1千円増加すると、千世帯当たりのパソコン所有数量が0.06125台増加です。つまり、1人当たり県民所得が10万円増加すると、千世帯当たりのパソコン所有数量が6.1台増加するということです。

educ_meanの係数は、10.76317なので、大学・大学院卒者の割合が1%増加すると、千世帯当たりのパソコン所有数量が10.8台増加するということです。かなり大きな値のように思います。

hobby_meanの係数は、7.56496です。趣味・娯楽の時間が1分増加すると、千世帯当たりのパソコン所有数量が7.6台増加するということです。これもかなり大きな値のように思います。

上の回帰分析は、複数年のデータを都道府県別に平均値をとって分析をしたものでした。

続いて、平均値をとらないで、個々の年のデータで分析してみます。

まず。shotokuに注目してみましょう。pcとshotokuのデータである年だけのデータフレームを作成します。

散布図を描いてみます。

パソコン所有数量と1人当たり県民所得のデータがあった年は、2004年、2009年、2014年の3年でした。いずれの年でも、1人当たり県民所得が大きいほうがパソコン所有数量も大きいようです。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

初めから読むには、

www.crosshyou.info

です。