の続きです。
今回は、R言語でSlope chartを作ります。
Slope chartは少数のデータの2時点の変化を見るのに便利なチャートです。
今回は、1977年と2007年の2時点で、北海道、宮城県、東京都、愛知県、大阪府、広島県、福岡県の人口100万人当りの苦情件数の変化を見てみましょう。
はじめに上のように、年と都道府県を設定しました。
このように、年は1977年と2007年、都道府県は指定した7都道府県だけ、per_totalがNAでないデータフレーム、datを作りました。
ここからは、
https://rafalab.github.io/dsbook/data-visualization-principles.html#plots-for-two-variables
このサイトを参考にします。
これは、
この本のWebバージョンです。
それはでやってみましょう。
Step1は上のようになります。mutate関数でlocationというX軸の座標を作ります。
1977年だったら1で、そうでなかったら、つまり2007年だったら2です。
次に、hjustを作ります。1977年だったら1、そうでなかったら、つまり2007年だったら1です。
step3では、yearをas.factor関数で数値型からファクター型に変換します。
ここまでで、データフレーム、datの処理は終了しました。
次からは、グラフ作成になります。
Step4ではggplot関数でggplotオブジェクトを作ります。pと名前をつけました。
Step5ではaes関数で、X軸をyearに、Y軸をper_totalに、groupをprefに指定しました。
Step5ではgeom_line関数で線グラフを描きます。これでグラフの骨格はできています。ためしに表示してみます。
こんな感じです。
Step6では、geom_text()関数でグラフに都道府県名を付けたします。
これも試しに表示してみましょう。
できましたね!愛知県だけ苦情件数が増えていることがわかります!
Step7でY軸ラベルを削除し、ggtitle関数でタイトルをつけで完成です。
表示してみます。
できました!
今回は以上です。