前回は、主要乳製品の伸び率を棒グラフで表示してみましたが、いまひとつ傾向がわかりませんでした。そこで今回はヒストグラムにしてみようと思います。
まずは、csvファイルにあるデータを読込みます。
伸び率のデータは、3, 5, 7, 9, 11, 13, 15, 17列にあります。伸び率だけのデータフレームを作成します。
伸び率の最小値と最大値を調べてみましょう。summary関数を使います。
最小の伸び率は、アイスクリームが記録した、-25.20%です。
最大の伸び率は、チーズが記録した、+65.7%です。
なので、ヒストグラムの範囲は、-30% ~ +70%にしましょう。
データの刻みは、5%刻みにしましょう。
それでは、hist関数を使ってヒストグラムを作成します。
はじめに、kugiri <- c(~~~ で区切りを設定しから、hist関数を使っています。freq=TRUEにして頻度がY軸に表示されるようにしています。これを警告の提案するようにfreq=FALSEにするとどうなるでしょうか?
Y軸がDensityとなります。
次は、れん乳類です。
お次は、全粉乳です。
チーズはどうでしょうか?
チーズは右端の部分にも度数がありますね。
次は、調製粉乳です。
次は、クリームです。
クリームはプラスの頻度が多いですね。
最後はアイスクリームです。
こうして、個々のヒストグラムを作成しましたが、どれも基本的には山型ですね。一つの画面に並べてみます。par(mfrow=c(2,4))という関数で、 2 x 4 にグラフを配置します。
それでは最後のこれらの伸び率を全部あわせたヒストグラムを作成してみましょう。
まずは、「伸び率」のデータフレームを行列に変換して、その行列をベクトルに変換してからhist関数を適用します。
右端の伸び率は、かなり飛び外れた伸び率だとわかります。