Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の自動車(バス)輸送統計調査のデータ分析2 - R のggplot() + geom_histogram() でヒストグラム

Bing Image Creator で生成: 透明感のある風景写真。大きな滝とスイセンの花

www.crosshyou.info

の続きです。

前回は、CSV ファイルを R に読み込ませてデータフレームを作成しました。

今回は読み込んだデータの視覚化、ヒストグラムを描いてみます。

まず、合計 のデータを削除しておきます。

general_num のヒストグラムを描きます。

ほとんどの観測データが左側に集中している分布形状です。こういう場合は、対数変換した値でヒストグラムを作成するとわかりやすいです。

若干ですが、2000年度よりも2022年度のほうが分布の中心が右側に移動しているように見えます。

次は、highway_num です。

これも対数変換してみます。

警告メッセージで3つデータが削除されたとあります、これは滋賀県ですね。

こちらのヒストグラムでは、よりはっきりと2022年度が右方向に移動していることがわかります。

次は、rental_num です。

これも対数変換します。

これも2022年度の分布が右方向へ移動しているようです。

次は、general_kilo です。

こちらも対数変換します。

general_kilo も2022年度のほうが右方向に分布が移動していますね。

次は、highway_kilo です。

これも対数変換します。

こちらも分布の中心が右方向に移動しているのが確認できますね。

最後の変数は、rental_kilo です。

これもやっぱり対数変換します。

いままでの変数と同じく、rental_kilo も分布が右方向に移動しています。

以上、各変数の分布のようすとヒストグラムでみてみました。

どれも、2020年度、2021年度、2022年度と年を経るにつれて、分布の位置が右方向に動いています。つまり、年々、増加しているということです。

今回は以上です。

次回は、

www.crosshyou.info

です。

 

初めから読むには、

www.crosshyou.info

です。