crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

産業別会社の財務営業比率の分析4 - R言語のgroup_by関数とsummarize関数でグループごとの平均値などを算出する

 

www.crosshyou.info

 の続きです。

今回はgroup_by関数とsummarize関数で産業別、年代別の平均値などを算出したいと思います。

データセットはこういうものでした。

f:id:cross_hyou:20181115093625j:plain

早速、group_by関数とsummarize関数を使って、借入金利子率の産業別の平均値を算出してみます。

f:id:cross_hyou:20181115094118j:plain

group_by関数で産業別にデータをまとめて、select関数で産業と借入金利子率だけを選択し、summarize関数で借入金利子率の平均を計算し、arrange関数で値の小さい順に表示しました。不動産業が一番、利子率が低く、運輸業が高いとわかります。

年代別ではどうでしょうか?

f:id:cross_hyou:20181115095136j:plain

利子率は年代が新しくなるほど低くなっています。このことを全産業だけの利子率のグラフを作成して確認してみましょう。

f:id:cross_hyou:20181115100618j:plain

f:id:cross_hyou:20181115100633j:plain

filter関数でdata3という全産業だけのデータセットを作り、ggplot関数のgeom_line関数でグラフにしました。ご覧のとおり、借入金利子率は長期的に低下傾向であることがわかります。

いちおう、全ての産業で利子率が低下傾向なのかをグラフにして確認しておきましょう。

f:id:cross_hyou:20181115101656j:plain

f:id:cross_hyou:20181115101713j:plain

ggplot関数のgeom_line関数で折れ線グラフを描き、facet_wrap関数で産業別に表示しています。すべての産業で利子率の低下傾向が確認できました。

今回は以上です。

 次回は

 

www.crosshyou.info

 です。