今回は、通信・放送産業動態調査のデータのヒストグラムを作成したいと思います。
まずは、R言語にデータを読み込ませます。csvファイルに保存してあるので、read.csv関数です。
head関数で始めの6行を表示して、summary関数でそれぞれのデータの平均値や中央値を表示しています。TOPIXは原データなので今回はヒストグラムは作成しません。また、全体、電気通信、放送、民放、ケーブルテレビの全部の最小値は、マイナス14で、全部の最大値は33.1なのでヒストグラムの範囲はマイナス15から35までにしようと思います。マイナス15から35までだと、50(35-(-15)=50)が範囲になるので、2.5を一つの区切りに使用と思います。
R言語でヒストグラムを作成する関数は、hist関数です。-15から35までの範囲で、2.5刻みで作成するには、breaks=seq(-15, 35, 2.5)というオプションを加えて、
hist(data$全体, breaks=seq(-15, 35, 2.5))と入力します。コマンド入力した結果がこうなります。
同じように他のデータもヒストグラムにしてみます。
TOPIX_CHGは最小値が -45.21で最大値が 62.36 なので範囲は 107.57です。一つの区分を5にして、-50から65までにしてみましょう。
hist(data$TOPIX_CHG, breaks=seq(-50, 65, 5))と入力しました。
こうしてヒストグラムで見るとTOPIXの前年同月比はマイナス方向にもプラス方向にもすそ野が広がっている形状だとわかります。