crosshyou

主にクロス表(分割表)分析をしようかなと思います。

牛乳乳製品の生産動向分析6 - 主要乳製品の伸び率をヒストグラムにする。(hist関数)

前回は、主要乳製品の伸び率を棒グラフで表示してみましたが、いまひとつ傾向がわかりませんでした。そこで今回はヒストグラムにしてみようと思います。

まずは、csvファイルにあるデータを読込みます。

f:id:cross_hyou:20180817110508j:plain

伸び率のデータは、3, 5, 7, 9, 11, 13, 15, 17列にあります。伸び率だけのデータフレームを作成します。

f:id:cross_hyou:20180817110700j:plain

伸び率の最小値と最大値を調べてみましょう。summary関数を使います。

f:id:cross_hyou:20180817110851j:plain

最小の伸び率は、アイスクリームが記録した、-25.20%です。

最大の伸び率は、チーズが記録した、+65.7%です。

なので、ヒストグラムの範囲は、-30% ~ +70%にしましょう。

データの刻みは、5%刻みにしましょう。

それでは、hist関数を使ってヒストグラムを作成します。

f:id:cross_hyou:20180817112030j:plain

f:id:cross_hyou:20180817112043j:plain

はじめに、kugiri <- c(~~~ で区切りを設定しから、hist関数を使っています。freq=TRUEにして頻度がY軸に表示されるようにしています。これを警告の提案するようにfreq=FALSEにするとどうなるでしょうか?

f:id:cross_hyou:20180817112413j:plain

f:id:cross_hyou:20180817112426j:plain

Y軸がDensityとなります。

脱脂粉乳の伸び率のヒストグラムです。

f:id:cross_hyou:20180817115025j:plain

f:id:cross_hyou:20180817115039j:plain

次は、れん乳類です。

f:id:cross_hyou:20180817115322j:plain

f:id:cross_hyou:20180817115339j:plain

お次は、全粉乳です。

f:id:cross_hyou:20180817115604j:plain

f:id:cross_hyou:20180817115618j:plain

チーズはどうでしょうか?

f:id:cross_hyou:20180817115847j:plain

f:id:cross_hyou:20180817115904j:plain

チーズは右端の部分にも度数がありますね。

次は、調製粉乳です。

f:id:cross_hyou:20180817120149j:plain

f:id:cross_hyou:20180817120201j:plain

次は、クリームです。

f:id:cross_hyou:20180817120417j:plain

f:id:cross_hyou:20180817120431j:plain

クリームはプラスの頻度が多いですね。

最後はアイスクリームです。

f:id:cross_hyou:20180817120730j:plain

f:id:cross_hyou:20180817120827j:plain

こうして、個々のヒストグラムを作成しましたが、どれも基本的には山型ですね。一つの画面に並べてみます。par(mfrow=c(2,4))という関数で、 2 x 4 にグラフを配置します。

f:id:cross_hyou:20180817121332j:plain

f:id:cross_hyou:20180817121456j:plain

それでは最後のこれらの伸び率を全部あわせたヒストグラムを作成してみましょう。

まずは、「伸び率」のデータフレームを行列に変換して、その行列をベクトルに変換してからhist関数を適用します。

f:id:cross_hyou:20180817122027j:plain

f:id:cross_hyou:20180817122041j:plain

右端の伸び率は、かなり飛び外れた伸び率だとわかります。