政府統計の総合窓口を訪問してみたら、
宿泊旅行統計調査という統計が新着でありました。ちょうといま、Go Toキャンペーンで話題の分野なので調べてみようと思います。
毎月実施されている調査なのですね。
データのExcelファイルをダウロードしたら、こんな感じでした。
データがたくさんあるので、今回は、従業者数の総計と観光目的の宿泊者が50%以上、50%未満の3つのデータだけにしました。2020年5月、2019年5月、2018年5月の過去3年のデータをダウロードしました。
こんな感じでCSVファイルにしました。
Year: 年
Pref: 都道府県
Total: 総従業者数
Tour: 観光目的が50%以上の宿泊施設の従業者数
Biz: 観光目的が50%未満の宿泊者施設の従業員数
です。
では、これをR言語のread.csv関数で読み込みます。
str関数でデータが読み込まれたか確認してみます。
あれ?なぜか1番目の変数がX.U.FEFF.Yearとなっています。colnames関数を利用してYearにします。
names関数で確認してみます。
Yearになっていることが確認できます。
summary関数でdfの統計値を確認しましょう。
このsummary関数の結果からわかることは、NA値が無いきれいなデータフレームであること、TourのほうがBizよりも大きいということがわかります。
2018年、2019年、2020年で宿泊施設の従業員は増えているのか、減少しているのか、tapply関数とsum関数で確認してみましょう。
合計の従業員数は、2018年が51,883人、2019年が54,867人、2020年が58,990人と増加しています。2020年5月時点では宿泊施設の従業員数は減っていないのですね。
観光目的、ビジネス目的それぞれも確認してみます。
観光目的の宿泊施設の従業員数は2018年は35,350人、2019年は38,730人、2020年は42,210人と毎年増加していますが、ビジネス目的の宿泊施設の従業員数は、2018年は14,270人、2019年は13,710人、2020年は13,770人と2018年と2020年を比べると減少していることがわかります。
今回は以上です。