鉱工業出荷内訳表の分析３ - データのバラツキをヒストグラムにして見える化する。(hist関数)

今回は、鉱工業出荷内訳表のデータのヒストグラムを作成しようと思います。

48のデータの種類全部をヒストグラムにするのは骨が折れるので、前回と同じく平均値が一番大きいデータのはん用.国内、平均値が一番小さいデータの情報通.国内、標準偏差の一番大きいデータの情報通.輸出、標準偏差の一番小さいデータの化学工.出荷の4つのデータについてヒストグラムを作成しようと思います。

まずは、read.csv関数でcsvファイルに保存してあるデータをR言語に読み込ませます。

f:id:cross_hyou:20180808224510j:plain

各データの平均値を計算して、平均値の大きい順に並び替えましょう。

apply関数とmean関数を使って各データの平均値を一括して計算します。そして、order関数で並び替えます。

f:id:cross_hyou:20180808224930j:plain

はん用.国内が111.0736で一番大きく、情報通.国内が66.0024で一番小さいですね。

apply関数とsd関数で各データの標準偏差を一括して計算します。そして、order関数で並び替えます。

f:id:cross_hyou:20180808225251j:plain

情報通.輸出の標準偏差が22.913790で一番大きく、化学工.出荷の標準偏差が4.024985で一番小さいことがわかります。

それでは、ヒストグラムを作成しましょう。hist関数を使います。

f:id:cross_hyou:20180808225954j:plain

f:id:cross_hyou:20180808230007j:plain

breaks = c(30,40,50,60,70,80,90,100,110,120,130,140,150,160)というオプション引数がヒストグラムの区間の区切りを指定しています。

次は、情報通.国内のヒストグラムです。

f:id:cross_hyou:20180808230546j:plain

f:id:cross_hyou:20180808230605j:plain

はん用.国内と違って、左に大きく偏っていますね。

次は、情報通.輸出です。

f:id:cross_hyou:20180808231323j:plain

f:id:cross_hyou:20180808231334j:plain

標準偏差が一番大きい、情報通.輸出ですから、幅が広いのがわかります。

標準偏差が一番小さい、化学工.出荷はこうなります。

f:id:cross_hyou:20180808232130j:plain

f:id:cross_hyou:20180808232142j:plain

化学工.出荷のデータは80から110の範囲しかないですね。

こうしてヒストグラムにすると、各データのバラツキがよくわかります。

最後に、4つのヒストグラムを1つの画面に配置してみましょう。

par(mfrow=c(4,1))という関数を作動させてから、4つのヒストグラムを作成します。

f:id:cross_hyou:20180808234042j:plain

f:id:cross_hyou:20180808234056j:plain

par(mfrow=c(4,1))という関数はグラフを、4行1列の配置で1つの画面に、という関数です。そして、col="red"などで色を付けました。

www.crosshyou.info