今回は県民経済計算のデータを使ってR言語のggplot関数で散布図を描いてみたいと思います。
まずは、前回やったCSVファイルに保存してあるデータをread.csv関数でR言語に読込み、summary関数で平均値などを表示します。
続いてggplot関数を使うために、library(tidyverse)というコマンドを入力します。
さて、どの組み合わせから散布図を描きましょうか?
まずは、cor関数で相関マトリックスを作成してから判断しましょう。
「県内総生産_名目」のデータと一番相関の高いのは「県内総生産_実質」です。一番相関の低いのは「対前年度増加率」です。これらのデータ項目で散布図を描いてみましょう。ggplot関数のgeom_point関数です。
対前年度増加率の大きいのはプロットのサイズが大きくなります。ほぼ一直線ですね。
もう一つ、県内総生産_名目と対前年度増加率の散布図はどうでしょうか?
左側のプロットのほうが上下に散らばっている感じがします。県内総生産の金額が大きくなるほど増加率の散らばりが小さくなっている感じがしますね。