www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

都道府県別の教育費のデータの分析2 - Rでデータをグラフにする。ggplot2パッケージのgeom_point(), geom_boxplot(), geom_line(), geom_histogram()

Photo by Antonio Sessa on Unsplash 

www.crosshyou.info

の続きです。

前回はデータをRに読み込みました。

今回はそのデータをいろいろグラフにしてみます。

まずは、都道府県別のed: 教育費(都道府県財政と市町村財政の合計)です。

mutate()関数の中でreorder()関数を使い、prefをedの値、中央値が大きい順に並び替えています。そして、ggplot()関数とgeom_pouint()関数でグラフを描き、coord_flip()関数でX軸とY軸を反転させ、theme_bw()関数でグラフの見た目を整えています。

東京都がダントツの金額規模です。鳥取県が一番少ないです。

edをlog()関数で対数変換してみます。

鳥取県はダントツで少ないです。

次は都道府県別のp_ratio: 都道府県財政の教育費の占める割合を見てみます。

東京都が一番p_ratioが低いのですね。高知県や和歌山県などがp_ratioが高いです。

次は、年別のedを見てみます。

ggplot(aes(year, ed, group = year))と yearでグループ化してから、geom_boxplot()関数で年別の箱ひげ図を作りました。全体としては横ばい傾向なのでしょうか?

折れ線グラフで年ごとの推移を見てみましょう。

ggpot(aes(year, ed, group = pref)) とgroup = pref で都道府県別にグループ化してから、

geom_line()関数で折れ線グラフにしました。やはり、横ばいという感じですね。

年別のp_ratioも見てみます。

p_ratioのほうが年ごとに違いがありそうですね。

折れ線グラフも描いてみましょう。

やはりp_ratioのほうが動きが激しい感じですね。

こんどはヒストグラムを描いてみます。

geom_histogram()関数でヒストグラムを描きます。上に青い丸の追加したいますが、3つの山があるようです。

対数に変換したヒストグラムも描いてみます。

対数変換した ed: 教育費でも山は3つあります。

p_ratioのヒストグラムを描きます。

p_ratioは左右対称の正規分布のようなヒストグラムですね。

今回は以上です。

今回はggplot2パッケージのgeom_point(), geom_line(), geom_boxplot(), geom_histogram()を使ってデータをグラフにしました。

次回は、

 

www.crosshyou.info

です。

初めから読むには、

 

www.crosshyou.info

です。