crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

鉄道車両生産動態統計調査のデータ分析2 - R言語のfilter関数で車両タイプを絞り込む

 

www.crosshyou.info

 の続きです。

このデータの車両の種類ですが、

f:id:cross_hyou:20201128202312p:plain

このように大分類・中分類・小分類と分類されているようです。

これをデータ分析に反映したいですよね。。

とりあえず、車両タイプをtable関数で表にしてみます。

f:id:cross_hyou:20201128203006p:plain

結構いっぱいありますね。。どうしましょうか?

サイトの分類を見て、鉄道車両 >>> 機関車 >>> 電気機関車 とある3番目のレベルの車両タイプを分析することに決めました。

これは、列挙すると、

電気機関車、ディーゼル機関車、その他の機関車、電車(新幹線を除く)、新幹線、ディーゼル車、客車、その他の旅客車、コンテナ車、タンク貨車、その他の貨物車

です。

filter関数で車両タイプを絞り込みます。

f:id:cross_hyou:20201128204724p:plain

table関数で絞り込みがうまくできているか確認します。

f:id:cross_hyou:20201128204956p:plain

うまく絞り込みできました。

必要のないファクター水準があるので、整理します。

f:id:cross_hyou:20201128205231p:plain

11番目の電車(新幹線を除く) は電車に変更していまいましょう。

f:id:cross_hyou:20201128205636p:plain

今回は以上です。