Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

全国輸出入コンテナ貨物流動調査のデータの分析2 - R言語のhist関数でヒストグラム、pairs関数で散布図マトリックス、cor関数で相関係数マトリックス

 

www.crosshyou.info

 の続きです。前回はデータファイルを整えるので終わってしまいました。

R言語のstr関数でデータフレームの構造を確認します。

f:id:cross_hyou:20190525153727j:plain

ExPxとInPxがなぜか数値ではなく、ファクターとして取り込まれています。

数値データに変換してみましょう。

まず、ファクタ型から文字列型に変換します。as.character関数ですね。

f:id:cross_hyou:20190525154126j:plain

次に、as.numeric関数で数値型に変換します。

f:id:cross_hyou:20190525154327j:plain

警告メッセージ: 強制変換により NA が生成されました と表示されました。

これは、数値として認識されなかった観測がNAに強制的に変換されたということですね。head関数でどんな感じになってるかみてみます。

f:id:cross_hyou:20190525154615j:plain

summary関数で基本統計量ををみてみます。

f:id:cross_hyou:20190525154757j:plain

NAの無い変数はないですね。na.omit関数でNAある行を削除します。

f:id:cross_hyou:20190525154957j:plain

summary関数でみてみます。

f:id:cross_hyou:20190525155142j:plain

head関数もみてみましょう。

f:id:cross_hyou:20190525155253j:plain

行の名前にPortのデータを入れて、Portの列を削除します。

f:id:cross_hyou:20190525155708j:plain

できました。6つの変数が揃っている港ってこれだけなんですね。

まずは、それぞれの変数をorder関数で並び替えて表示します。

f:id:cross_hyou:20190525160011j:plain

小樽が輸出数量が一番少なく、那覇が一番多いです。ExPxはどうでしょうか?

f:id:cross_hyou:20190525160202j:plain

小樽のコンテナの価格が一番安く、舞鶴が一番高いです。重さ当りの価格はどうでしょうか?

f:id:cross_hyou:20190525160418j:plain

那覇が一番安く、小樽が一番高いです。

輸入量はどうでしょうか?

f:id:cross_hyou:20190525160646j:plain

三池が一番少なく、堺泉北が一番多いです。コンテナ当りの価格はどうでしょうか?

f:id:cross_hyou:20190525160917j:plain

小樽が安く、浜田が高いです。

重さ当りの価格はどうでしょうか?

f:id:cross_hyou:20190525161121j:plain

堺泉北が一番安く、石狩湾新が一番高いです。

今度はそれぞれの変数のヒストグラムを描いてみましょう。

f:id:cross_hyou:20190525161437j:plain

f:id:cross_hyou:20190525161448j:plain

attach関数でdf_Analysisをアタッチしたので、hist(df_Analysis$ExAmt)とせずに、hist(ExAmt)でヒストグラムが描けます。

次は、ExPXです。

f:id:cross_hyou:20190525161842j:plain

f:id:cross_hyou:20190525161852j:plain

次は、ExPxTです。

f:id:cross_hyou:20190525162019j:plain

f:id:cross_hyou:20190525162029j:plain

あ、これは二極化していますね。
次は、InAmtです。

f:id:cross_hyou:20190525162154j:plain

f:id:cross_hyou:20190525162204j:plain

InPXはどうでしょうか?

f:id:cross_hyou:20190525162339j:plain

f:id:cross_hyou:20190525162349j:plain

InPxTはどうでしょうか?

f:id:cross_hyou:20190525162522j:plain

f:id:cross_hyou:20190525162535j:plain

 

ExPxTが二極化しているほかは山型の分布ですね。

pairs関数で散布図を描きます。

f:id:cross_hyou:20190525162938j:plain

f:id:cross_hyou:20190525162952j:plain

cor関数で相関マトリックスを表示します。

f:id:cross_hyou:20190525163238j:plain

今回は以上です。最後にdetach関数で、df_Analysisをデタッチしておきます。

f:id:cross_hyou:20190525163423j:plain

今回は以上です。

 次回は

 

www.crosshyou.info

です。