crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

鉄道車両生産動態統計調査の分析3 - R言語のgroup_by関数とsummarise関数を使う。「その他の新幹線」は1台当りの車両の金額は11億3600万円

 

www.crosshyou.info

 の続きです。

前回作成した、車両タイプを絞り込んだデータフレームを使って、車両タイプごとの1台当りの車両の金額を調べてみます。

group_by関数でtrain_type: 車両タイプでグループ化して、summarise関数とmean関数で平均値を計算しました。

f:id:cross_hyou:20201129091757p:plain

千円単位なので、一番高い電気機関車は、3億2889万6千円です。一番安いのはコンテナ車で2288万円です。

生産台数はどの車両タイプが一番多いでしょうか?

f:id:cross_hyou:20201129092511p:plain

電車が1万2171両、新幹線が3422両とわかります。客車はNAですね。

新造はされていないのですね。

ここで、prod_typeにはどんなのがあるか確認しておきます。

table関数を使います。

f:id:cross_hyou:20201129092931p:plain

新造の他に改造・修理などありますね。。

f:id:cross_hyou:20201129093327p:plain

ウェブサイトで確認すると、「総計」が一番上のレベルで、2番目に「新造」と「改造・修理」があるようです。

なので、「新造」と「改造・修理」の2つだけに絞ります。

f:id:cross_hyou:20201129093846p:plain

prod_type, year, train_typeには不要なファクター水準があるかもしれないので整理します。

f:id:cross_hyou:20201129094158p:plain

group_by関数は2つ以上の変数でグループ化できます。prod_typeとtrain_typeの2つでグループ化して、1台当りの車両の金額の平均値を算出してみます。

f:id:cross_hyou:20201129095206p:plain

新造の電気機関車が3億4000万円、ディーゼル機関車が2億6000万円、ディーゼル車が1億7000万円、新幹線が1億6000万円、電車が9700万円ぐらいの金額なのですね。

train_typeが一番下の分類で金額が一番高いのは何か、みてみましょう。

dfのデータフレームでやってみます。

f:id:cross_hyou:20201129100041p:plain

「その他の新幹線」という車両タイプが1台当りの金額が11億3600万円でダントツに高額ですね。交直流電気機関車が3億5000万円、その他のディーゼル車が3億4000万円です。

今回は以上です。