Rで何かをしたり、読書をするブログ

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の宿泊旅行統計調査の分析2 - R言語のDataExplorerパッケージを利用してみる。

 

www.crosshyou.info

 の続きです。

前回の分析で、2018年と2020年を比べると、観光メインの宿泊施設の従業員数は増えていましたが、ビジネスメインの宿泊施設の従業員数は減少していました。

今回は、DataExplorerという便利なパッケージを使ってデータをいろいろ可視化してみようと思います。

まずは、library関数でパッケージを読み込みます。

library関数でDataExplorerパッケージを読み込む。

plot_str関数でデータフレームの構造を見てみます。

plot_str関数

plot_str関数

こんな感じです。

続いて、plot_missing関数で、NAの数を数えましょう。

plot_missing関数

plot_missing関数

すべての変数でNAはありません。

 

plot_histogram関数でヒストグラムを描きます。

plot_histogram関数

plot_histogram関数

簡単に各変数のヒストグラムができます。

 

plot_density関数でデンシティープロットを描きます。

plot_density関数

plot_density関数

plot_correlation関数で相関係数マトリックスです。

plot_correlation関数

plot_correlation関数

 

plot_bar関数でカテゴリカル変数の度数をチャートにします。

plot_bar関数

plot_bar関数

このように、DataExplorerパッケージを利用すると、簡単にデータフレームの視覚化ができます。

今回の記事は、

https://towardsdatascience.com/simple-fast-exploratory-data-analysis-in-r-with-dataexplorer-package-e055348d9619

の記事を参考にしました。

今回は以上です。