今回は、自動車輸送統計調査の営業バスのデータを使って、伸び率を計算してみようと思います。前回の分析では利用人数が多いのは人口の多い都道府県でした。伸び率が高い、あるいは低いのはどんな都道府県でしょうか?
まずは、データをread.csv関数で読み込みます。summary関数でデータの要約統計量を表示します。
平成22年度から平成29年度への伸び率を計算します。
BusData[ , 3]がBusDataの3列目、つまり乗合定期人数29年を示し、BusData[ , 8]が乗合定期人数22年を表します。こうして作ったデータと地域、都道府県のデータを結合させて、新しいデータフレームを作ります。列データを結合してデータフレームを作成するには、cbind関数を使います。
はい、このようにうまくできました。summary関数で要約統計量をみてみましょう。
平均値を見てみましょう。
乗合定期人数伸び率は、1.0603 で増加しています。
乗合定期外伸び率は、0.9816 で減少しています。
乗合人キロ伸び率は、1.0907 で増加しています。
貸切人数伸び率は、0.9515 で減少しています。
貸切人キロ伸び率は、0.7227 で減少しています。
貸切バスは人数、人キロともに減少しているのですね。
ヒストグラムを作成して分布を見てみましょう。5つのデータで最小値は、貸切人キロ伸び率の0.4595で、最大値は乗合人キロ伸び率の2.4414ですから、0.25-0.50, 0.50-0.75, 0.75-1.00, 1.00-1.25, 1.25-1.50, 1.50-1.75, 1.75-2.00, 2.00-2.25, 2.25-2.50 の10区間でヒストグラムを作成します。
乗合定期人数伸び率のヒストグラムです。
lables=TRUEと追加すると、度数も一緒に表示されます、乗合定期人数伸び率は、0.75より大きく1.0以下が19、1.0より大きく1.25以下が19と同数でした。
乗合定期外伸び率のヒストグラムはどうでしょうか?
乗合定期外伸び率は、0.75より大きく1.0以下が30と大半を占めています。ひとつだけ、2.0より大きく2.25未満の都道府県があります。どこでしょうか?あとで見てみましょう。
乗合人キロ伸び率はどうでしょうか?
1.0より大きく1.25以下のレンジが19で最多でした。
貸切人数伸び率はどうでしょうか?
0.75より大きく1.0以下のレンジが22で最多です。
貸切人キロ伸び率はどうなるでしょうか?
貸切人キロ伸び率は1.0より大きい、つまり増加したところは2つしかないですね。
plot関数で5つの伸び率の散布図を表示しましょう。
このような散布図マトリックスになります。貸切人数伸び率と貸切人キロ伸び率は相関関係がるように見えますが、その他はあんまりですね。