
の続きです。
今回は各変数の上位都市、下位都市はどういう都市か確認します。
mitsudo: 人口密度から見ていきます。


可住地面積1平方km当りの人数です。一番多いのは、豊島区で22781人で、一番少ないのは山口氏の792人です。
次は昼夜人口比率です。


一番高いのは千代田区の1408%です。昼は夜の14倍の人がいるということですかね。
一番低いのは練馬区の81.8%です。2割ぐらいの人が他の区や市に昼間はいる、ということですね。
ここで、昼夜人口比率が100以上と100未満というダミー変数を作っておきます。

次はhanbaiです。これは、従業者1人当たりの年間商品販売額で百万円単位です。小売業と卸売業の合計です。


あ、今気が付きましたが、特別区部が入ってしまっていますね。
削除しましょう。

4つ目の変数はtaxです。これは納税義務者1人当たりの課税対象額で千円単位です。


港区の人が一番、所得が多いようです。
今回は以上です。
次回は、
です。
はじめから読むには、
です。
今回のコードは以下になります。
#
# mitsudoの上位都市
df |>
group_by(city) |>
summarize(avg_mitsudo = mean(mitsudo)) |>
arrange(desc(avg_mitsudo))
#
# mitsudoの下位都市
df |>
group_by(city) |>
summarize(avg_mitsudo = mean(mitsudo)) |>
arrange(avg_mitsudo)
#
# daynightの上位都市
df |>
group_by(city) |>
summarize(avg_daynight = mean(daynight)) |>
arrange(desc(avg_daynight))
#
# daynightの下位都市
df |>
group_by(city) |>
summarize(avg_daynight = mean(daynight)) |>
arrange(avg_daynight)
#
# daynight >= 100 なら1、 < 100なら0のダミー変数を作る
df <- df |>
mutate(day = if_else(daynight >= 100, 1, 0))
#
# hanbaiの上位都市
df |>
group_by(city) |>
summarize(avg_hanbai = mean(hanbai)) |>
arrange(desc(avg_hanbai))
#
# hanbaiの下位都市
df |>
group_by(city) |>
summarize(avg_hanbai = mean(hanbai)) |>
arrange(avg_hanbai)
#
# 東京都 特別区部 を削除
df <- df |>
filter(city != "東京都 特別区部")
#
# taxの上位都市
df |>
group_by(city) |>
summarize(avg_tax = mean(tax)) |>
arrange(desc(avg_tax))
#
# taxの下位都市
df |>
group_by(city) |>
summarize(avg_tax = mean(tax)) |>
arrange(avg_tax)
#
(冒頭の画像は、Bing Image Creator で生成しました。プロンプトは Close up photo of Matsutake, it grows under pine trees, photo です。