Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の道路平均交通量の分析2 - データの視覚化 - 大阪府が一番の交通量

(Bing Image Creator で生成: プロンプト: Close up of pink or purple Phlox subutata flowers, flowering on the sloped hill, blue sky, photo)

www.crosshyou.info

の続きです。今回はデータをグラフにして、どういうデータなのか、だいたいの感覚をつかむことにします。

その前に各変数の対数変換値を作成しておきます。

では、kotsu: 道路平均交通量(台/12h)からみてみます。ヒストグラムを描きます。

上のヒストグラムが2015年度で、下のヒストグラムが2020年度です。なんとなく、2020年度のほうが値が小さいように見えます。

l_kotsu: 対数変換したkotusもヒストグラムにします。

やっぱり、2020年度のほうが全体的に交通量が減っているように見えます。

次は、pop: 15~64歳人口(人)です。

対数変換したpop, l_popのヒストグラムも描きます。

対数にしたほうが、2020年度のほうが人口が減っているのがわかります。

次は、inc: 1人当たり県民所得(千円)です。

2020年度のほうが減少している感じです。

l_inc: incの対数値のヒストグラムを描きます。

対数のほうが値が減少していることがはっきりわかります。

次は、kotsu: 道路平均交通量(台/12h)のランキングをみてみましょう。

2015年度と2020年度の平均値を計算して、それを棒グラフにしました。

大阪府が東京都よりも交通量が多いのですね。神奈川県、埼玉県、愛知県、千葉県と続きます。交通量が少ないところは、島根県、高知県、北海道、青森県、秋田県などです。

今回は以上です。

次回は

www.crosshyou.info

です。

 

初めから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# 各変数の自然対数を追加
df <- df |> 
  mutate(l_pop = log(pop),
         l_inc = log(inc),
         l_kotsu = log(kotsu))
#
# kotsu: 道路平均交通量(台/12h)のヒストグラム
df |> 
  ggplot(aes(x = kotsu)) +
  geom_histogram(aes(fill = year),
                 bins = 10, color = "white") +
  facet_wrap(~ year, nrow = 2)
#
# l_kotsu: 道路平均交通量(台/12h)の対数のヒストグラム
df |> 
  ggplot(aes(x = l_kotsu)) +
  geom_histogram(aes(fill = year),
                 bins = 10, color = "white") +
  facet_wrap(~ year, nrow = 2)
#
# pop: 15~64歳人口(人)のヒストグラム
df |> 
  ggplot(aes(x = pop)) +
  geom_histogram(aes(fill = year),
                 bins = 10, color = "white") +
  facet_wrap(~ year, nrow = 2)
#
# l_pop: 15~64歳人口(人)の対数のヒストグラム
df |> 
  ggplot(aes(x = l_pop)) +
  geom_histogram(aes(fill = year),
                 bins = 10, color = "white") +
  facet_wrap(~ year, nrow = 2)
#
# inc: 1人当たり県民所得(千円)のヒストグラム
df |> 
  ggplot(aes(x = inc)) +
  geom_histogram(aes(fill = year),
                 bins = 10, color = "white") +
  facet_wrap(~ year, nrow = 2)
#
# l_inc: 1人当たり県民所得(千円)の対数のヒストグラム
df |> 
  ggplot(aes(x = l_inc)) +
  geom_histogram(aes(fill = year),
                 bins = 10, color = "white") +
  facet_wrap(~ year, nrow = 2)
#
# kotsuの都道府県ランク
df |> 
  group_by(pref) |> 
  summarize(average_kotsu = mean(kotsu)) |> 
  mutate(pref = reorder(pref, average_kotsu)) |> 
  ggplot(aes(x = pref, y = average_kotsu)) +
  geom_col() +
  coord_flip()
#