の続きです。
今回はデータを可視化して、どの都道府県が図書館が多いのか少ないのか、データの分布形状はどうなっているのかを見てみます。
まずは、library:図書館数です。ggplot2のgeom_bar関数を使います。
mutate(pref = reorder(pref, library))でprefをlibraryの大きい順に並び替えてから、ggplotとgeom_bar関数で棒グラフにしています。corrd_flip関数で縦軸と横軸を入れ替えています。
図書館数の多い上位は、東京都、埼玉県、大阪府です。
図書館数の少ない下位は、和歌山県、佐賀県、徳島県です。
books:蔵書冊数はどうでしょうか?
蔵書冊数の多いところは、東京都、大阪府、埼玉県です。
蔵書冊数の少ないところは高知県、和歌山県、島根県です。
pople:図書館登録者数をみてみます。
登録者数の多いところは、東京都、神奈川県、大阪府です。
登録者数の少ないところは福井県、高知県、大分県です。
rental:図書館外貸出冊数はどうでしょうか?
貸出冊数の多いところは、東京都、大阪府、愛知県です。
貸出冊数の少ないところは、高知県、秋田県、島根県です。
続いて、geom_histgram関数でヒストグラムをみてみます。
まずは、library:図書館数です。
一番右の分布は東京都ですね。それ以外は200以下ですね。100以下がほとんどです。
people:登録者数ののヒストグラムはどうでしょうか?
一番右は東京都で、その次の分布は神奈川県ですね。
books:蔵書冊数のヒストグラムをみてみましょう。
一番右は東京都ですね。
最後はrental:貸出冊数をみてみます。
貸出冊数も一番右は東京都ですね。
4つの変数すべて、一番右の東京都がダントツに値が大きくて、対数正規分布のような形状の分布ですね。
今回は以上です。
次回は
です。
はじめから読むには、
です。