Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

全国の主要都市の人口密度、昼夜人口比率、商品販売額、課税所得のデータの分析3 - 各変数の上位都市と下位都市

www.crosshyou.info

の続きです。

今回は各変数の上位都市、下位都市はどういう都市か確認します。

mitsudo: 人口密度から見ていきます。

可住地面積1平方km当りの人数です。一番多いのは、豊島区で22781人で、一番少ないのは山口氏の792人です。

次は昼夜人口比率です。

一番高いのは千代田区の1408%です。昼は夜の14倍の人がいるということですかね。

一番低いのは練馬区の81.8%です。2割ぐらいの人が他の区や市に昼間はいる、ということですね。

ここで、昼夜人口比率が100以上と100未満というダミー変数を作っておきます。

次はhanbaiです。これは、従業者1人当たりの年間商品販売額で百万円単位です。小売業と卸売業の合計です。

あ、今気が付きましたが、特別区部が入ってしまっていますね。

削除しましょう。

4つ目の変数はtaxです。これは納税義務者1人当たりの課税対象額で千円単位です。

港区の人が一番、所得が多いようです。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

はじめから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# mitsudoの上位都市
df |> 
  group_by(city) |> 
  summarize(avg_mitsudo = mean(mitsudo)) |> 
  arrange(desc(avg_mitsudo))
#
# mitsudoの下位都市
df |> 
  group_by(city) |> 
  summarize(avg_mitsudo = mean(mitsudo)) |> 
  arrange(avg_mitsudo)
#
# daynightの上位都市
df |> 
  group_by(city) |> 
  summarize(avg_daynight = mean(daynight)) |> 
  arrange(desc(avg_daynight))
#
# daynightの下位都市
df |> 
  group_by(city) |> 
  summarize(avg_daynight = mean(daynight)) |> 
  arrange(avg_daynight)
#
# daynight >= 100 なら1、 < 100なら0のダミー変数を作る
df <- df |> 
  mutate(day = if_else(daynight >= 100, 1, 0))
#
# hanbaiの上位都市
df |> 
  group_by(city) |> 
  summarize(avg_hanbai = mean(hanbai)) |> 
  arrange(desc(avg_hanbai))
#
# hanbaiの下位都市
df |> 
  group_by(city) |> 
  summarize(avg_hanbai = mean(hanbai)) |> 
  arrange(avg_hanbai)
#
# 東京都 特別区部 を削除
df <- df |> 
  filter(city != "東京都 特別区部")
#
# taxの上位都市
df |> 
  group_by(city) |> 
  summarize(avg_tax = mean(tax)) |> 
  arrange(desc(avg_tax))
#
# taxの下位都市
df |> 
  group_by(city) |> 
  summarize(avg_tax = mean(tax)) |> 
  arrange(avg_tax)
#

 

 

(冒頭の画像は、Bing Image Creator で生成しました。プロンプトは Close up photo of Matsutake, it grows under pine trees, photo です。