www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

県民経済計算の分析2 - ggplot関数のgeom_point関数で散布図を描く

今回は県民経済計算のデータを使ってR言語のggplot関数で散布図を描いてみたいと思います。

まずは、前回やったCSVファイルに保存してあるデータをread.csv関数でR言語に読込み、summary関数で平均値などを表示します。

f:id:cross_hyou:20181017122815j:plain

続いてggplot関数を使うために、library(tidyverse)というコマンドを入力します。

f:id:cross_hyou:20181017122912j:plain

さて、どの組み合わせから散布図を描きましょうか?

まずは、cor関数で相関マトリックスを作成してから判断しましょう。

f:id:cross_hyou:20181017123124j:plain

「県内総生産_名目」のデータと一番相関の高いのは「県内総生産_実質」です。一番相関の低いのは「対前年度増加率」です。これらのデータ項目で散布図を描いてみましょう。ggplot関数のgeom_point関数です。

f:id:cross_hyou:20181017123740j:plain

f:id:cross_hyou:20181017123810j:plain

対前年度増加率の大きいのはプロットのサイズが大きくなります。ほぼ一直線ですね。

もう一つ、県内総生産_名目と対前年度増加率の散布図はどうでしょうか?

f:id:cross_hyou:20181017124247j:plain

f:id:cross_hyou:20181017124258j:plain

左側のプロットのほうが上下に散らばっている感じがします。県内総生産の金額が大きくなるほど増加率の散らばりが小さくなっている感じがしますね。