政府統計の総合窓口(e-Stat)のホームページを見たら、「自動車輸送統計調査」というデータが新着でありました。
自動車輸送統計調査は、国内で輸送活動を行う自動車を対象とする統計調査で、国の最も重要な統計調査として毎月実施しています。
自動車輸送統計調査から得られる輸送量等は、国や地方公共団体の経済政策及び交通政策を策定するための基礎資料の作成等に役立てられています。
自動車輸送統計調査では、輸送トン数(輸送人員)、輸送トンキロ(輸送人キロ)等の調査結果を、全国、地方運輸局別、6大都府県別等の区分で提供しています。
とのことです。
このデータの
「営業用バス(乗合・貸切9都道府県別輸送量」というファイルを開いてみました。
こういう感じのデータです。輸送人員数や輸送人キロが都道府県別にまとめられています。
このデータの平成29年度と平成22年度のデータを分析してみようと思います。
まずは、R言語に読込ませるようにCSVファイルをこんな感じで作成しました。
都道府県がそれぞれのデータレコードの名前で、地域という属性データがあって、数値データが平成29年度のデータが5列、平成22年度のデータが5列の10項目です。
read.csv関数で読込み、summary関数でデータの要約統計量をだしましょう。
単位は千です。平均値だけ確認しましょう。
平成29年度の
乗合定期人数は、2305万1000人
乗合定期外人数は、5887万8000人
乗合人キロは、6億4641万5000人キロ
貸切人数は、561万0000人
貸切人キロは、5億5215万7000人キロ
平成22年度の
乗合定期人数は、2038万4000人
乗合定期外人数は、5807万2000人
乗合人キロは、5億3992万1000人キロ
貸切人数は、566万1000人
貸切人キロは、7億7997万9000人キロ
でした。
これだけ見ても面白いですね。
乗合バスでは、定期で乗る人よりも、定期外で乗る人のほうが多い。
貸切の人数は乗合よりも断然少ないが、人キロ(人数 X 輸送キロ)で見ると多かったりあまり変わらなくなる。つまり貸切バスは輸送キロが断然長い。
などわかります。
apply関数とsd関数でそれぞれの数値データの標準偏差を計算しましょう。
上の段が29年度で下の段が22年度になってくれました。貸切人キロが29年度と22年度でけっこう大きく変化していますね。
標準偏差を平均値で割って「変動係数」を出してみましょう。
都道府県ごとののバラツキが一番大きいのは平成29年度の乗合定期外人数のようですね。