今回は、自動車輸送統計調査の営業バスのデータを使って、一人当りの移動距離を計算してみようと思います。
まずは、CSVファイルに保存してあるデータをread.csv関数でR言語に読込みます。
head関数で、最初の6行のデータを表示し、summary関数でデータの要約統計量を算出しました。このデータを見ると、人数と、人キロというデータ、これは人数 X 輸送キロメートルはありますが、輸送キロメートルはありません。なので、輸送キロメートル = 人キロ / 人数 を算出してみようと思います。
こうやって計算し、新たにデータフレームを作成し、summary関数でデータを要約してみます。cbind関数で各データを結合して、データフレームを作成します。
平均値を見ると、
乗合輸送キロ29年は、13.098 Km
貸切輸送キロ29年は、124.76 Km
乗合輸送キロ22年は、13.276 Km
貸切輸送キロ22年は、163.59 Km
です。貸切輸送がかなり短くなっていますね。
それぞれの項目で並び替えてみます。
乗合輸送キロ29年はこうなりました。
距離が長いのは、香川、徳島、山形、高知、長野、鳥取です。
距離が短いのは、奈良、滋賀、神奈川、兵庫、京都、千葉です。
四国に距離が長い県が多いですね。
貸切輸送29年はこうなりました。
距離が長いのは、徳島、山梨、高知、佐賀、愛媛、長野です。
距離が短いには、千葉、福井、神奈川、沖縄、宮城、青森です。
乗合輸送キロ22年はどうでしょうか?
距離の長いのは、香川、徳島、高知、鳥取、山形、島根です。
距離の短いのは、奈良、滋賀、神奈川、和歌山、兵庫、京都です。
貸切輸送キロ22年はこうなりました。
距離の長いのは、愛媛、高知、徳島、和歌山、山梨、岐阜です。
距離の短いのは、千葉、沖縄、福井、神奈川、室蘭、釧路です。
四国は距離が長いですね。
それぞれのデータをヒストグラムで表示します。
上段が29年で下段が22年です。左が乗合、右が貸切です。
貸切の距離が22年と比べると29年は短いほう(左方向)にシフトしているように見えます。乗合のほうはちょっと微妙ですね。