
の続きです。
今回はどの都市が刑法犯認知件数が多いか、どの都道府県が多いかを確認します。
まずは単純にcrimeの大きい順に並び替えてみます。

東京都千代田区が一番多いことがわかります。千代田区は住んでる人と比べて、働いている人が多いですからこんなふうになってしまうんですかね。
少ないところもみてみましょう。

静岡県浜松市や三重県津市、長崎県佐世保市などが少ないですね。
ここまでは単純な並びかえでした。今度は市ごとに各年の平均を出して、平均値でみてみます。
件数の多いところからみてみます。

東京都千代田区、東京都中央区、東京都渋谷区、と上位は東京都ですね。大阪市、福岡市、名古屋市と続きます。
少ないところはどこでしょうか?

長崎県佐世保市が一番少なくて、2番目が長崎県長崎市です。山口県山口市、静岡県浜松市と続きます。
今度は、都道府県別に集計しましょう。
cityは長崎県 佐世保市のように、都道府県名があって、1つスペースがあって市の名前が入っていますので、これを分割して、prefとcityにします。
separate()関数で都道府県名と市の名前に分割できます。

都道府県別の平均値を計算して、crimeの多いところをみてみます。

東京都が一番多く、福岡県、京都府、高知県、沖縄県、和歌山県、岐阜県、大阪府、千葉県、愛媛県となっています。人口の多い東京都や大阪府などもあれば、人口の少ない高知県などもありますね。
刑法犯認知件数が少ないところはどこでしょうか?

長崎県が一番少ないです。鳥取県、青森県、富山県、大分県、石川県、山口県、三重県、静岡県、佐賀県と続いています。
今回は以上です。
次回は、
です。
はじめから読むには、
です。
今回のコードは以下になります。
#
# crimeの多いところはどこか
df_crime |>
arrange(desc(crime))
#
# crimeの少ないところはどこか
df_crime |>
arrange(crime)
#
# crimeの市の平均で多いところはどこか
df_crime |>
group_by(city) |>
summarize(mean = mean(crime)) |>
arrange(desc(mean))
#
# crimeの市の平均で少ないところはどこか
df_crime |>
group_by(city) |>
summarize(mean = mean(crime)) |>
arrange(mean)
#
# cityと都道府県名と市の名前にわける
df_crime <- df_crime |>
separate(city, into = c("pref", "city"), sep = " ")
df_crime
#
# 都道府県別のcrimeの多いところ
df_crime |>
group_by(pref) |>
summarize(mean = mean(crime)) |>
arrange(desc(mean))
#
# 都道府県別のcrimeの少ないところ
df_crime |>
group_by(pref) |>
summarize(mean = mean(crime)) |>
arrange(mean)
#
(冒頭の画像は Bing Image Creator で生成しました。プロンプトは Clear landscape of various colors of Pansy flowers, blue sky, Photo です。)