(Bing Image Creator で生成: プロンプト: Close up of pink or purple Phlox subutata flowers, flowering on the sloped hill, blue sky, photo)
の続きです。今回はデータをグラフにして、どういうデータなのか、だいたいの感覚をつかむことにします。
その前に各変数の対数変換値を作成しておきます。
では、kotsu: 道路平均交通量(台/12h)からみてみます。ヒストグラムを描きます。
上のヒストグラムが2015年度で、下のヒストグラムが2020年度です。なんとなく、2020年度のほうが値が小さいように見えます。
l_kotsu: 対数変換したkotusもヒストグラムにします。
やっぱり、2020年度のほうが全体的に交通量が減っているように見えます。
次は、pop: 15~64歳人口(人)です。
対数変換したpop, l_popのヒストグラムも描きます。
対数にしたほうが、2020年度のほうが人口が減っているのがわかります。
次は、inc: 1人当たり県民所得(千円)です。
2020年度のほうが減少している感じです。
l_inc: incの対数値のヒストグラムを描きます。
対数のほうが値が減少していることがはっきりわかります。
次は、kotsu: 道路平均交通量(台/12h)のランキングをみてみましょう。
2015年度と2020年度の平均値を計算して、それを棒グラフにしました。
大阪府が東京都よりも交通量が多いのですね。神奈川県、埼玉県、愛知県、千葉県と続きます。交通量が少ないところは、島根県、高知県、北海道、青森県、秋田県などです。
今回は以上です。
次回は
です。
初めから読むには、
です。
今回のコードは以下になります。
#
# 各変数の自然対数を追加
df <- df |>
mutate(l_pop = log(pop),
l_inc = log(inc),
l_kotsu = log(kotsu))
#
# kotsu: 道路平均交通量(台/12h)のヒストグラム
df |>
ggplot(aes(x = kotsu)) +
geom_histogram(aes(fill = year),
bins = 10, color = "white") +
facet_wrap(~ year, nrow = 2)
#
# l_kotsu: 道路平均交通量(台/12h)の対数のヒストグラム
df |>
ggplot(aes(x = l_kotsu)) +
geom_histogram(aes(fill = year),
bins = 10, color = "white") +
facet_wrap(~ year, nrow = 2)
#
# pop: 15~64歳人口(人)のヒストグラム
df |>
ggplot(aes(x = pop)) +
geom_histogram(aes(fill = year),
bins = 10, color = "white") +
facet_wrap(~ year, nrow = 2)
#
# l_pop: 15~64歳人口(人)の対数のヒストグラム
df |>
ggplot(aes(x = l_pop)) +
geom_histogram(aes(fill = year),
bins = 10, color = "white") +
facet_wrap(~ year, nrow = 2)
#
# inc: 1人当たり県民所得(千円)のヒストグラム
df |>
ggplot(aes(x = inc)) +
geom_histogram(aes(fill = year),
bins = 10, color = "white") +
facet_wrap(~ year, nrow = 2)
#
# l_inc: 1人当たり県民所得(千円)の対数のヒストグラム
df |>
ggplot(aes(x = l_inc)) +
geom_histogram(aes(fill = year),
bins = 10, color = "white") +
facet_wrap(~ year, nrow = 2)
#
# kotsuの都道府県ランク
df |>
group_by(pref) |>
summarize(average_kotsu = mean(kotsu)) |>
mutate(pref = reorder(pref, average_kotsu)) |>
ggplot(aes(x = pref, y = average_kotsu)) +
geom_col() +
coord_flip()
#