今回は、花き産業振興総合調査のデータで、花き産業は衰退しているのかを見てみたいと思います。
まずは、read.csv関数でデータを読み込み、summary関数でデータの要約を表示します。
出荷額の推移を年ごとにみてみましょう。tapply関数とsum関数で年ごとの出荷額の合計値を出します。
2009年の出荷額合計が93億6900万円で、2016年が64億4700万円です。barplot関数でグラフにしてみます。
全体としては減少傾向ですが、2013年と2014年は増加しています。
この出荷額の傾向を回帰分析で分析してみたいと思います。lm関数を使います。
はじめに、年 <- c(2009:2016)で2009年から2016年のベクトルを作っています。
次に、回帰分析結果 <- lm(出荷額合計 ~ 年) という式で回帰分析を実行しています。これは、
出荷額合計 = a * 年 + 誤差項
とう回帰式の回帰分析で、その分析結果を「回帰分析結果」という名前で格納しています。そして、sumary(回帰分析結果)で分析結果の要約を表示しています。
この要約のEstimateが回帰式の係数です。つまり、
出荷額合計 = -346.61 * 年 + 705598.25
ということです。1年経過するたびに、出荷額が3億4661万円減少するっていうことです。やっぱり、衰退傾向なんですね。
一番下の p-value = 0.005943 が、この回帰式が意味があるかどうかを表しています。p-value = 0.005943 < 0.05 ですから有意です。
そして、
この部分の赤線のところが、年の係数、-346.61が有意かどうかを表していて、0.00594 < 0.05 ですから有意とわかります。全体としての花き産業の出荷額は、年々減少していると言えます。
また、
Multiple R-squared: 0.7426 とあります。これがいわゆる決定係数(R2)ですね。出荷額と年の相関係数の2乗が、0.7426ということです。
そういえば、出荷額が増加していましたよね。モミジの出荷額で同じように回帰分析してみましょう。
まずは、モミジだけのデータフレームを作ります。
出荷額の棒グラフを作成してみます。
barplot関数が棒グラフを作成する関数で、main="~~"でグラフのタイトルw設定し、ylim=c(0,1000)でY軸の範囲を0から1000にして、names.arg=c(2009:2016)でX軸のラベルを2009から2016にしています。
減少傾向ではないですね。lm関数で回帰分析します。
推定された回帰式は、
モミジの出荷額 = 13.27 * 年 - 25932.42
です。1年経過すると出荷額が1327万円増える!と思いますが、一番下のp-valueを見てください。p-value = 0.2586 > 0.05 ですから、この回帰式は有意ではない、ということです。モミジの出荷額が増加傾向にある、とは言えないです。
今回は、lm関数で出荷額を年で回帰分析しました。その結果、出荷額は年々減少していることが統計的に有意だとわかりました。