crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別の宿泊旅行統計調査の分析1 - 2018年5月と2020年5月の比較では、観光メインの従業員数は増加している。

政府統計の総合窓口を訪問してみたら、

宿泊旅行統計調査

宿泊旅行統計調査という統計が新着でありました。ちょうといま、Go Toキャンペーンで話題の分野なので調べてみようと思います。

宿泊旅行統計調査

毎月実施されている調査なのですね。

データのExcelファイルをダウロードしたら、こんな感じでした。

宿泊旅行統計調査

データがたくさんあるので、今回は、従業者数の総計と観光目的の宿泊者が50%以上、50%未満の3つのデータだけにしました。2020年5月、2019年5月、2018年5月の過去3年のデータをダウロードしました。

宿泊旅行統計調査

こんな感じでCSVファイルにしました。
Year: 年
Pref: 都道府県
Total: 総従業者数

Tour: 観光目的が50%以上の宿泊施設の従業者数

Biz: 観光目的が50%未満の宿泊者施設の従業員数

です。

では、これをR言語のread.csv関数で読み込みます。

read.csv関数でCSVファイルを読み込む

str関数でデータが読み込まれたか確認してみます。

str関数でデータの構造を確認

あれ?なぜか1番目の変数がX.U.FEFF.Yearとなっています。colnames関数を利用してYearにします。

colnames関数

names関数で確認してみます。

names関数

Yearになっていることが確認できます。

summary関数でdfの統計値を確認しましょう。

summary関数

このsummary関数の結果からわかることは、NA値が無いきれいなデータフレームであること、TourのほうがBizよりも大きいということがわかります。

2018年、2019年、2020年で宿泊施設の従業員は増えているのか、減少しているのか、tapply関数とsum関数で確認してみましょう。

tapply関数とsum関数

合計の従業員数は、2018年が51,883人、2019年が54,867人、2020年が58,990人と増加しています。2020年5月時点では宿泊施設の従業員数は減っていないのですね。

観光目的、ビジネス目的それぞれも確認してみます。

tapply関数とsum関数

観光目的の宿泊施設の従業員数は2018年は35,350人、2019年は38,730人、2020年は42,210人と毎年増加していますが、ビジネス目的の宿泊施設の従業員数は、2018年は14,270人、2019年は13,710人、2020年は13,770人と2018年と2020年を比べると減少していることがわかります。

今回は以上です。