今回は、鉱工業出荷内訳表のデータを使って、前回のブログで作成した、輸出 / 国内 比率の推移をグラフにしてみようと思います。
まずは、前回までのおさらいで、R言語のコマンドを実行します。実行したコマンドは以下のようなものです。
# 鉱工業出荷内訳表データの読込みます。
内訳表 <- read.csv("shukka.csv")
# 輸出だけのデータを作成します。
輸出だけ <- 内訳表[ , c(5,8,11,14,17,20,23,26,29,32,35,38,41,44,47,50)]
# 国内だけのデータを作成します。
国内だけ <- 内訳表[ , c(6,9,12,15,18,21,24,27,30,33,36,39,42,45,48,51)]
# 輸出 / 国内 比率を作成します。
比率 <- 輸出だけ / 国内だけ
# 比率のデータフレームの列名の変更を変更します。
colnames(比率) <- c("鉱工業","鉄鋼業","非鉄金","金属製","はん用","電子部","電気機","情報通", "輸送機","窯業","化学工","化学除","石油","プラス","パルプ","繊維工")
こうして「比率」というデータフレームが作成できました。これの基本統計量を表示しましょう。summary関数で平均値、中央値、最小値、最大値、第1分位値、第3分位値を表示、sd関数で標準偏差を計算します。
最大値を記録した業種は、情報通で1.6620でした。
最小値を記録した業種は、石油で0.5660でした。
標準偏差の最大値を記録した業種は、情報通で0.19094568でした。
標準偏差の最小値を記録した業種は、鉱工業で0.05909062でした。
今回は、情報通、石油、鉱工業の3つの業種をグラフにしましょう。plot関数を使います。
このようになりました。鉱工業は標準偏差が一番小さいだけあって、変動があまりないですね。
plot関数は、main="~~"でグラフのタイトル、ylim=c(xx,yy)でY軸の範囲、type="~"でグラフのタイプを指定します。l(エル)だと、線グラフになります。
この3つのグラフを重ねて作図してみましょう。
par(new=TRUE)というコマンドを使います。
ylab="~"でY軸のラベルを指定しています。