crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

牛乳乳製品の生産動向分析7 - 主要乳製品の生産量の割合(as.matrix関数, prop.table関数, as.data.frame関数)

今回は、主要乳製品の生産量の割合を見てみようと思います。平成〇〇年は脱脂粉乳は20%でチーズは25%だった。。というような割合です。

まずはcsvファイルに保存してあるデータをread.csv関数でR言語に読込ませます。

f:id:cross_hyou:20180818095309j:plain

生産量のデータだけのデータフレームを作成します。

f:id:cross_hyou:20180818095421j:plain

アイスクリームの生産量はキロリットルで、その他はトンです。アイスクリームを削除したデータフレームを作成します。

f:id:cross_hyou:20180818095710j:plain

最初に全体の乳製品の生産量のトレンドをみてみましょう。apply関数とsum関数で行ごとの合計した値をplot関数でグラフにします。

f:id:cross_hyou:20180818100245j:plain

f:id:cross_hyou:20180818100257j:plain

始めの4つのデータは、クリームが集計されていないので、合計値が極端に少ないですね。クリームが集計された年からのデータフレームに作り変えましょう。

f:id:cross_hyou:20180818100617j:plain

5行目からスタートしています。もう一度グラフを作成してみます。

f:id:cross_hyou:20180818100900j:plain

f:id:cross_hyou:20180818100913j:plain

最近は低下傾向ですね。

それでは、各製品の割合をみてみましょう。prop.table関数で行ごとの割合、列ごとの割合というのが計算できますが、この関数はマトリックスでないと動かないので、as.matrix関数でデータフレームをマトリックスに変換してからprop.table関数を適用します。

f:id:cross_hyou:20180818101551j:plain

このままでは、5行目は平成何年かわからないので、cbind関数をつかって、年度のデータと合体させます。まずは、as.data.frame関数でデータフレームに変換してからcbind関数を使います。

f:id:cross_hyou:20180818103139j:plain

こうやってから、、

f:id:cross_hyou:20180818103212j:plain

いちおうできましたが、1列目の列名が、milk[c(-1,-2,-3,-4), 1]という名前になっていますので、年度になおしましょう。

f:id:cross_hyou:20180818104006j:plain

できました。

昭和60年はチーズの生産量割合は13.13%でしたが、平成29年には28.00%になっています。