Photo by Antonio Sessa on Unsplash
の続きです。
前回はデータをRに読み込みました。
今回はそのデータをいろいろグラフにしてみます。
まずは、都道府県別のed: 教育費(都道府県財政と市町村財政の合計)です。
mutate()関数の中でreorder()関数を使い、prefをedの値、中央値が大きい順に並び替えています。そして、ggplot()関数とgeom_pouint()関数でグラフを描き、coord_flip()関数でX軸とY軸を反転させ、theme_bw()関数でグラフの見た目を整えています。
東京都がダントツの金額規模です。鳥取県が一番少ないです。
edをlog()関数で対数変換してみます。
鳥取県はダントツで少ないです。
次は都道府県別のp_ratio: 都道府県財政の教育費の占める割合を見てみます。
東京都が一番p_ratioが低いのですね。高知県や和歌山県などがp_ratioが高いです。
次は、年別のedを見てみます。
ggplot(aes(year, ed, group = year))と yearでグループ化してから、geom_boxplot()関数で年別の箱ひげ図を作りました。全体としては横ばい傾向なのでしょうか?
折れ線グラフで年ごとの推移を見てみましょう。
ggpot(aes(year, ed, group = pref)) とgroup = pref で都道府県別にグループ化してから、
geom_line()関数で折れ線グラフにしました。やはり、横ばいという感じですね。
年別のp_ratioも見てみます。
p_ratioのほうが年ごとに違いがありそうですね。
折れ線グラフも描いてみましょう。
やはりp_ratioのほうが動きが激しい感じですね。
こんどはヒストグラムを描いてみます。
geom_histogram()関数でヒストグラムを描きます。上に青い丸の追加したいますが、3つの山があるようです。
対数に変換したヒストグラムも描いてみます。
対数変換した ed: 教育費でも山は3つあります。
p_ratioのヒストグラムを描きます。
p_ratioは左右対称の正規分布のようなヒストグラムですね。
今回は以上です。
今回はggplot2パッケージのgeom_point(), geom_line(), geom_boxplot(), geom_histogram()を使ってデータをグラフにしました。
次回は、
です。
初めから読むには、
です。