crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

外資系企業動向調査の分析4 - R言語で操業率、撤退率、開業率の散布図を作成する。ggplotパッケージを使用。

 

www.crosshyou.info

 の続きです。

今回は合計、非製造業、製造業という業種の大分類を除いたtibbleを作成してggplot2パッケージでグラフをいろいろ作りたいと思います。

まずは、filter関数、mutate関数、as.character関数、factor関数を使って個別業種だけのtibbleを作成します。

f:id:cross_hyou:20190223143340j:plain

操業率を追加しましょう。

f:id:cross_hyou:20190223143738j:plain

これでグラフ作成のためのtibbleが作成できました。

操業率をヒストグラムにしてみましょう。

ggplot関数とgeom_histogram関数です。

f:id:cross_hyou:20190223144214j:plain

f:id:cross_hyou:20190223144225j:plain

操業率が0%の観測がいくつかあることがわかります。これらの観測を削除して、再度ヒストグラムを作成してみます。

f:id:cross_hyou:20190223144605j:plain

f:id:cross_hyou:20190223144621j:plain

操業率が70%以下のものもありますね。

年度と操業率を組み合わせたグラフを作成してみます。

ggplot関数とgeom_freqpoly関数です。

f:id:cross_hyou:20190223145413j:plain

f:id:cross_hyou:20190223145429j:plain

年度ごとの操業率の分布はあんまり変わりがないような気がします。

業種と操業率はどうでしょうか?

f:id:cross_hyou:20190223145758j:plain

f:id:cross_hyou:20190223145810j:plain

線が多すぎて何が何だかよくわかりませんね。。

今度は、操業率と操業中を見てみましょう。ggplot関数とgeom_point関数で散布図を描きます。

f:id:cross_hyou:20190223150335j:plain

f:id:cross_hyou:20190223150347j:plain

操業中の数で1000以上、250から500の間、250未満という3つのグループに分けることができますね。250未満のグループだけで散布図を描いてみます。

f:id:cross_hyou:20190223150815j:plain

f:id:cross_hyou:20190223150846j:plain

年度ごとに色分けしてみます。

f:id:cross_hyou:20190223151358j:plain

f:id:cross_hyou:20190223151415j:plain

年度によっての違いは無いですね。

撤退ヒストグラムを作成してみましょう。0を除いて作成します。

f:id:cross_hyou:20190223152057j:plain

f:id:cross_hyou:20190223152111j:plain

40以上撤退している業種もありますね。

撤退の大きい観測を表示してみましょう。arrange関数ですね。

f:id:cross_hyou:20190223152356j:plain

あ、全部卸売業ですね。撤退 / 合計 で撤退率という変数を作成しましょう。mutate関数ですね。

f:id:cross_hyou:20190223152930j:plain

撤退率で並び替えてみましょう。arrange関数ですね。

f:id:cross_hyou:20190223153211j:plain

そうだ、開業率 = 設立後初決算前 / 合計 x 100 という変数も作成しましょう。

f:id:cross_hyou:20190223153619j:plain

変数の数が多くなって、Rコンソール画面にきれいに表示されなくなりましたね。

分析に必要な変数だけに絞り込んだ新たなtibbleを作成します。

f:id:cross_hyou:20190223153930j:plain

いい感じですね。

開業率で並び替えてみます。

f:id:cross_hyou:20190223154107j:plain

操業率と撤退率の散布図を描いてみましょう。

f:id:cross_hyou:20190223154502j:plain

f:id:cross_hyou:20190223154516j:plain

右肩下がりの逆相関ですね。

操業率と開業率はどうでしょうか?

f:id:cross_hyou:20190223154725j:plain

f:id:cross_hyou:20190223154737j:plain

開業率が0%の観測を削除してもう一度散布図を描いてみます。

f:id:cross_hyou:20190223155044j:plain

f:id:cross_hyou:20190223155141j:plain

相関はなさそうですね。

撤退率と開業率の関係はどうでしょうか?

f:id:cross_hyou:20190223155430j:plain

f:id:cross_hyou:20190223155446j:plain

撤退率、開業率が 0% の観測を除外して散布図を描いてみます。

f:id:cross_hyou:20190223155755j:plain

f:id:cross_hyou:20190223155812j:plain

相関はないようですね。

今回は以上です。

 次回は

 

www.crosshyou.info

 

です。