crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の図書館数などのデータの分析2 - R言語で各データを可視化する。ggplot2のgeom_bar関数とgeom_hist関数。

 

www.crosshyou.info

 の続きです。

今回はデータを可視化して、どの都道府県が図書館が多いのか少ないのか、データの分布形状はどうなっているのかを見てみます。

まずは、library:図書館数です。ggplot2のgeom_bar関数を使います。

f:id:cross_hyou:20210117195440p:plain

f:id:cross_hyou:20210117195456p:plain

mutate(pref = reorder(pref, library))でprefをlibraryの大きい順に並び替えてから、ggplotとgeom_bar関数で棒グラフにしています。corrd_flip関数で縦軸と横軸を入れ替えています。
図書館数の多い上位は、東京都、埼玉県、大阪府です。

図書館数の少ない下位は、和歌山県、佐賀県、徳島県です。

books:蔵書冊数はどうでしょうか?

f:id:cross_hyou:20210117195837p:plain

f:id:cross_hyou:20210117195851p:plain

蔵書冊数の多いところは、東京都、大阪府、埼玉県です。

蔵書冊数の少ないところは高知県、和歌山県、島根県です。

pople:図書館登録者数をみてみます。

f:id:cross_hyou:20210117200045p:plain

f:id:cross_hyou:20210117200059p:plain

登録者数の多いところは、東京都、神奈川県、大阪府です。

登録者数の少ないところは福井県、高知県、大分県です。

rental:図書館外貸出冊数はどうでしょうか?

f:id:cross_hyou:20210117200300p:plain

f:id:cross_hyou:20210117200315p:plain

貸出冊数の多いところは、東京都、大阪府、愛知県です。

貸出冊数の少ないところは、高知県、秋田県、島根県です。

続いて、geom_histgram関数でヒストグラムをみてみます。

まずは、library:図書館数です。

f:id:cross_hyou:20210117200515p:plain

f:id:cross_hyou:20210117200528p:plain

一番右の分布は東京都ですね。それ以外は200以下ですね。100以下がほとんどです。

people:登録者数ののヒストグラムはどうでしょうか?

f:id:cross_hyou:20210117200732p:plain

f:id:cross_hyou:20210117200746p:plain

一番右は東京都で、その次の分布は神奈川県ですね。

books:蔵書冊数のヒストグラムをみてみましょう。

f:id:cross_hyou:20210117201001p:plain

f:id:cross_hyou:20210117201020p:plain

一番右は東京都ですね。

最後はrental:貸出冊数をみてみます。

f:id:cross_hyou:20210117201139p:plain

f:id:cross_hyou:20210117201157p:plain

貸出冊数も一番右は東京都ですね。

4つの変数すべて、一番右の東京都がダントツに値が大きくて、対数正規分布のような形状の分布ですね。

今回は以上です。

次回は

 

www.crosshyou.info

 です。

 

はじめから読むには、

 

www.crosshyou.info

 です。