Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

2009年の東京都のJR駅の乗車人数のデータの分析2 - arrange()関数でデータフレームを並び替え

Bing Image Creator で生成: Long view landscape, full of wild flowers field, photo

 

www.crosshyou.info

の続きです。

今回は、arrange()関数でデータの並び替えをします。

まず、一番total(トータルの乗車人数)の多い駅はどこでしょうか?

新宿駅が一番ですね。2億7321万1千人です。池袋駅、渋谷駅、東京駅、品川駅と続きます。

その反対に一番totalが少ない駅はどこでしょうか?

少ない駅は全部、青梅線です。

白丸駅が2万9千人で最小です。鳩ノ巣駅、川井駅、軍畑駅、沢井駅と続きます。

次は、pass(定期券での乗車人数)の一番大きい駅はどこでしょうか?

新宿駅が一番です。1億4539万6千人です。池袋駅、渋谷駅、東京駅、品川駅と続きます。

その反対に一番少ない駅はどこでしょうか?

やっぱり青梅線が少ない駅ですね。白丸駅が1万4千人で一番少ないです。

鳩ノ巣駅、沢井駅、川井駅、御嶽駅、軍畑駅と続きます。

onetime(定期でなくて、普通の乗車人数)の多い駅はどこでしょうか?

同じですね。新宿駅が1億2781万4千人で一番多く、池袋駅、渋谷駅、東京駅、品川駅と続きます。

一番少ない駅はどうでしょうか?

白丸駅が一番少ない駅でした。1万6千です。軍畑駅、川井駅、宮ノ平駅、石神前駅と続きます。

次は、onetimeの比率が一番高い駅を調べましょう。

はじめにmutate()関数で新しい変数、onetime_ratio を onetime / total で作成してから、arrange()関数で並び替えています。desc()関数を使っているので、値の大きい順に並び替えています。

御嶽駅、奥多摩駅、原宿駅、沢井駅、千駄ヶ谷駅となりました。青梅線の駅は山登りなどの行楽客が多いので、onetimeの比率が高いのでしょうね。原宿駅は、多くの若者たちが来ますし明治神宮の初詣でも利用されます。千駄ヶ谷駅は国立競技場で大きな試合があるときは利用客が増えますよね。

それでは、onetime_ratioの低い駅はどこでしょうか?

北八王子駅が0.188で一番低い値でした。定期券を使った通勤客、通学客が利用の中心ですね。北府中駅、宮ノ平駅、北千住駅、八王子みなみ野駅と続きます。

今回はarrange()関数、arrange(desc())関数でデータフレームを並び替えました。新宿駅は総合でも、定期券利用でも普通利用でも一番の乗車人数でした。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

初めから読むには、

www.crosshyou.info

です。

今回のコードは以下になります。

#
# 一番totalの多い駅は?
df |> 
  arrange(desc(total))
#
# 一番totalの少ない駅は?
df |> 
  arrange(total)
#
# 一番passの多い駅は?
df |> 
  arrange(desc(pass))
#
# 一番passの少ない駅は?
df |> 
  arrange(pass)
#
# 一番onetimeの多い駅は?
df |> 
  arrange(desc(onetime))
#
# 一番onetimeの少ない駅は?
df |> 
  arrange(onetime)
#
# onetime比率(onetime / total)の大きい駅は?
df <- df |> 
  mutate(onetime_ratio = onetime / total)
df |> 
  arrange(desc(onetime_ratio))
#
# onetime_ratioの低い駅は?
df |> 
  arrange(onetime_ratio)
#