crosshyou

主にクロス表(分割表)分析をしようかなと思います。

通信・放送産業動態調査の分析3 - ヒストグラムでデータの度数分布を見える化(R言語のhist関数)

今回は、通信・放送産業動態調査のデータのヒストグラムを作成したいと思います。

まずは、R言語にデータを読み込ませます。csvファイルに保存してあるので、read.csv関数です。

f:id:cross_hyou:20180710210317j:plain

head関数で始めの6行を表示して、summary関数でそれぞれのデータの平均値や中央値を表示しています。TOPIXは原データなので今回はヒストグラムは作成しません。また、全体、電気通信、放送、民放、ケーブルテレビの全部の最小値は、マイナス14で、全部の最大値は33.1なのでヒストグラムの範囲はマイナス15から35までにしようと思います。マイナス15から35までだと、50(35-(-15)=50)が範囲になるので、2.5を一つの区切りに使用と思います。

R言語ヒストグラムを作成する関数は、hist関数です。-15から35までの範囲で、2.5刻みで作成するには、breaks=seq(-15, 35, 2.5)というオプションを加えて、

hist(data$全体, breaks=seq(-15, 35, 2.5))と入力します。コマンド入力した結果がこうなります。

f:id:cross_hyou:20180710212303j:plain

同じように他のデータもヒストグラムにしてみます。

f:id:cross_hyou:20180710212526j:plain

f:id:cross_hyou:20180710212721j:plain

f:id:cross_hyou:20180710212857j:plain

f:id:cross_hyou:20180710215101j:plain

TOPIX_CHGは最小値が -45.21で最大値が 62.36 なので範囲は 107.57です。一つの区分を5にして、-50から65までにしてみましょう。

hist(data$TOPIX_CHG, breaks=seq(-50, 65, 5))と入力しました。

f:id:cross_hyou:20180710220021j:plain

こうしてヒストグラムで見るとTOPIXの前年同月比はマイナス方向にもプラス方向にもすそ野が広がっている形状だとわかります。