Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

花き産業振興総合調査の分析5 - 花き産業は衰退傾向と言えるのか?回帰分析で確認(lm関数)

今回は、花き産業振興総合調査のデータで、花き産業は衰退しているのかを見てみたいと思います。

まずは、read.csv関数でデータを読み込み、summary関数でデータの要約を表示します。

f:id:cross_hyou:20180807141009j:plain

出荷額の推移を年ごとにみてみましょう。tapply関数とsum関数で年ごとの出荷額の合計値を出します。

f:id:cross_hyou:20180807141434j:plain

2009年の出荷額合計が93億6900万円で、2016年が64億4700万円です。barplot関数でグラフにしてみます。

f:id:cross_hyou:20180807141739j:plain

f:id:cross_hyou:20180807141755j:plain

全体としては減少傾向ですが、2013年と2014年は増加しています。

この出荷額の傾向を回帰分析で分析してみたいと思います。lm関数を使います。

f:id:cross_hyou:20180807142558j:plain

はじめに、年 <- c(2009:2016)で2009年から2016年のベクトルを作っています。

次に、回帰分析結果 <- lm(出荷額合計 ~ 年) という式で回帰分析を実行しています。これは、

出荷額合計 = a * 年 + 誤差項

とう回帰式の回帰分析で、その分析結果を「回帰分析結果」という名前で格納しています。そして、sumary(回帰分析結果)で分析結果の要約を表示しています。

この要約のEstimateが回帰式の係数です。つまり、

出荷額合計 = -346.61 * 年 + 705598.25

ということです。1年経過するたびに、出荷額が3億4661万円減少するっていうことです。やっぱり、衰退傾向なんですね。

一番下の p-value = 0.005943 が、この回帰式が意味があるかどうかを表しています。p-value = 0.005943 < 0.05 ですから有意です。

そして、

f:id:cross_hyou:20180807144025j:plain

この部分の赤線のところが、年の係数、-346.61が有意かどうかを表していて、0.00594 < 0.05 ですから有意とわかります。全体としての花き産業の出荷額は、年々減少していると言えます。

また、

f:id:cross_hyou:20180807150818j:plain

Multiple R-squared: 0.7426 とあります。これがいわゆる決定係数(R2)ですね。出荷額と年の相関係数の2乗が、0.7426ということです。

そういえば、出荷額が増加していましたよね。モミジの出荷額で同じように回帰分析してみましょう。

まずは、モミジだけのデータフレームを作ります。

f:id:cross_hyou:20180807144511j:plain

出荷額の棒グラフを作成してみます。

f:id:cross_hyou:20180807144641j:plain

f:id:cross_hyou:20180807144652j:plain

barplot関数が棒グラフを作成する関数で、main="~~"でグラフのタイトルw設定し、ylim=c(0,1000)でY軸の範囲を0から1000にして、names.arg=c(2009:2016)でX軸のラベルを2009から2016にしています。

減少傾向ではないですね。lm関数で回帰分析します。

f:id:cross_hyou:20180807150014j:plain

推定された回帰式は、

モミジの出荷額 = 13.27 * 年 - 25932.42

です。1年経過すると出荷額が1327万円増える!と思いますが、一番下のp-valueを見てください。p-value = 0.2586 > 0.05 ですから、この回帰式は有意ではない、ということです。モミジの出荷額が増加傾向にある、とは言えないです。

今回は、lm関数で出荷額を年で回帰分析しました。その結果、出荷額は年々減少していることが統計的に有意だとわかりました。