の続きです。
前回作成した、車両タイプを絞り込んだデータフレームを使って、車両タイプごとの1台当りの車両の金額を調べてみます。
group_by関数でtrain_type: 車両タイプでグループ化して、summarise関数とmean関数で平均値を計算しました。
千円単位なので、一番高い電気機関車は、3億2889万6千円です。一番安いのはコンテナ車で2288万円です。
生産台数はどの車両タイプが一番多いでしょうか?
電車が1万2171両、新幹線が3422両とわかります。客車はNAですね。
新造はされていないのですね。
ここで、prod_typeにはどんなのがあるか確認しておきます。
table関数を使います。
新造の他に改造・修理などありますね。。
ウェブサイトで確認すると、「総計」が一番上のレベルで、2番目に「新造」と「改造・修理」があるようです。
なので、「新造」と「改造・修理」の2つだけに絞ります。
prod_type, year, train_typeには不要なファクター水準があるかもしれないので整理します。
group_by関数は2つ以上の変数でグループ化できます。prod_typeとtrain_typeの2つでグループ化して、1台当りの車両の金額の平均値を算出してみます。
新造の電気機関車が3億4000万円、ディーゼル機関車が2億6000万円、ディーゼル車が1億7000万円、新幹線が1億6000万円、電車が9700万円ぐらいの金額なのですね。
train_typeが一番下の分類で金額が一番高いのは何か、みてみましょう。
dfのデータフレームでやってみます。
「その他の新幹線」という車両タイプが1台当りの金額が11億3600万円でダントツに高額ですね。交直流電気機関車が3億5000万円、その他のディーゼル車が3億4000万円です。
今回は以上です。