UnsplashのBoris Smokrovicが撮影した写真
の続きです。
前回は都道府県ごとの統計値のデータフレーム、(stat_prefと名前をつけた)、を作成しました。今回はこのデータフレームを並び替えてどういう都道府県が値が大きいのかを調べてみます。
median, 中央値の大きい順に並び替えてみます。order()関数とrev()関数を使います。
東京都、大阪府、神奈川県、愛知県と人口が多く、経済活動が活発なところが上位ですね。
plot()関数とtext()関数をつかってグラフにしてみます。
こうしてグラフにしてみると、東京都がダントツだとわかります。
こんどは、medianの小さい順に見てみます。
奈良県、秋田県、徳島県、和歌山県などが一人当たりの売上高の中央値が小さいです。
これもグラフにしてみましょうかね。
今回はコードを1行、1行に書いて、コメントも入れてみました。本当はggplot2パッケージでグラフを描くほうが簡単だと思いますが、敢えて原始的な方法で作図しています。手作り感があって楽しいです。
奈良県は値が小さいですね。
こんどは mean の大きいところを見てみます。今回見ている統計値は、産業別の一人当たり売上高を都道府県別に平均値や中央値を計算したものです。
東京都、大阪府、愛知県、宮城県が上位でした。
反対に、meanの小さいところはどこでしょうか?
奈良県、滋賀県、埼玉県、沖縄県が小さいところです。
max, 最大値の大きいところはどこでしょうか?
東京都、大阪府、愛知県、宮城県が大きいです。東京都の10.304は東京都のある産業セクターは一人当たりの売上高が1030万4千円ということです。ある、産業というのは selling, 卸売・小売のセクターですね。
maxのちいさいところを見てみます。
奈良県、滋賀県、沖縄県、千葉県がちいさいところです。
sd, 標準偏差の大きなところはどこでしょうか?
東京都、大阪府、愛知県、宮城県がsd, 標準偏差が大きいです。
小さいところはどこでしょうか?
奈良県、滋賀県、沖縄県、千葉県が小さいです。
変動係数の大きなところを見てみましょう。
愛知県、群馬県、宮城県、大阪府が変動係数が大きいです。産業セクター別の一人当たりの売上高のバラツキ度合いが大きいということですね。
小さいところはどこでしょうか?
神奈川県、沖縄県、千葉県、三重県が小さいです。
今回はデータフレームを大きい順、小さい順に並び替えてみました。
今回は以上です。
次回は、
です。
初めから読むには、
です。