Photo by Alex Machado on Unsplash
今回は都道府県別のあんま・マッサージ師、はり・きゅう師、柔道整復師数のデータを分析してみようと思います。
まず、政府統計の総合窓口、e-stat.go.jpからデータをダウンロードします。
47の都道府県を選択し、
総人口、あんま・マッサージ師数、はり・きゅう師数、柔道整復師数を選択しました。
このようなCSVファイルを取得できたので、これをRで分析します。
前準備としてtidyverseパッケージの読み込みをしておきます。
read_csv()関数でCSVファイルを読み込みます。
head()関数で頭の数行を表示してみます。
yearを100000を引いてから1000000で割って普通の4桁の西暦に戻すのとNAのある行を削除しましょう。
summary()関数でdfを見てみます。
yearが4桁の西暦になっていることがわかります。一番古いデータは、1975年で、一番新しいデータは2018年です。
year2は195年度などの文字列です。
codeは北海道が1000, 沖縄が47000です。
prefは都道府県名の文字列です。
popは総人口、一番少ない都道府県・年は560,000人、一番多い都道府県・年は13,822,000人です。
anmassageはあんま・マッサージ師の数です。一番少ないのは61人、多いのは27,399人です。
harikyuはり・きゅう師の数です。一番少ないのは138人、多いのは43,909人です。
judoは柔道整復師数です。一番少ないのは3人、多いのは11,105人です。
はり・きゅう師 > あんま・マッサージ師 > 柔道整復師数 という感じの人数ですね。
年ごとの合計のデータフレームを作って、それぞれの経年変化をみてみます。
group_by()関数やsummarize()関数を使って、年ごとの合計値のデータフレームを作成しました。これをplot()関数とline()関数でグラフにて、legend()関数で凡例を表示します。
はり・きゅう師の伸びが加速している感じですね。
今度は、都道府県別の状況を見てみましょう。
人口百万人当たりの数を計算して、それをくらべましょう。
こんな感じでmutate()関数で人口当たりの数の変数を作りました。
一番新しい2018年のデータで比べてみます。
東京都がダントツに多いですね。人口当たりの数のであんま・マッサージ師は2000人近くいます。岩手県が一番少なく500人以下ですね。
はり・きゅう師はどうでしょうか?
はり・きゅう師は大阪が一番ですね。東京は2番です。
柔道整復師数はどうでしょうか?
大阪が一番多いですね。
今回は以上です。
次回は
です。