www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の仕事の平均時間のデータ分析5 - R言語でRidge Plotというものを描く。

f:id:cross_hyou:20210911100750j:plain

Photo by Mark Harpur on Unsplash 

www.crosshyou.info

rafalab.github.io

というものでRidge Plotというものを知りましたので、忘れないうちに実践です。

Ridge Plotはあるデータ(身長、体重、所得など)の分布をグループごとに見るときに便利です。

早速、東日本と西日本で、fm_pop: 女性(15~64歳の人口)/男性(15~64歳)の人口 の分布を比べてみましょう。

まず、ggridgesというパッケージの読み込みをします。

f:id:cross_hyou:20210911101329p:plain

geom_関数は、geom_density_ridges()という関数になります。

f:id:cross_hyou:20210911102123p:plain

f:id:cross_hyou:20210911102136p:plain

上の密度分布が東日本で、下が西日本です。違いがはっきりわかりますね。

観測数が今回は47都道府県であまり多くないですから箱ひげ図の上に実際のデータを載せてもいいかもしれないですね。

f:id:cross_hyou:20210911102756p:plain

f:id:cross_hyou:20210911102807p:plain

これでも東日本と西日本のfm_popの違いがよくわかりますね。

今回は以上です。

次回は、

 

www.crosshyou.info

です。

 

はじめから読むには

 

www.crosshyou.info

です。