www.crosshyou.info

政府統計の総合窓口のデータや、OECDやUCIやのデータを使って、Rの練習をしています。ときどき、読書記録も載せています。

消費者物価指数の分析4 - R言語のggplot関数のgeom_point関数で散布図を描く

引き続き、

 

www.crosshyou.info

 の続きです。前回の分析で「総合」と正の相関が一番強いのが「履物類」、負の相関が一番強いのが「家庭用.耐久財」、無相関に一番近いのが「通信」だとわかりました。

今回はこの3変数の組み合わせで散布図を描いてみたいと思います。R言語のplot関数でも散布図は描けますが、今回は年代によって相関が変わっているかを見てみたいと思いますので、ggplot関数を使ってみたいと思います。

最近、

 

Rではじめるデータサイエンス

Rではじめるデータサイエンス

 

 を買って読み始めましたので、その練習も兼ねています。

まず、「年」のデータから、「年代」のデータを作成します。cut関数です。

breaks <- で区切りを設定し、labelsでそれぞれの区切りの名前を設定しています。そしてcut関数で「年代」の変数を作り、table関数でそれぞれの年代の要素数を表示しました。

ggplot関数を呼び出すためにlibrary(tidyverse)と入力します。

f:id:cross_hyou:20181101112814j:plain

それではggplotで散布図を描きます。

f:id:cross_hyou:20181101113628j:plain

f:id:cross_hyou:20181101113641j:plain

facet_wrapで年代別にパネルを分けています。

「総合」と「家庭用.耐久財」はどうでしょうか?

f:id:cross_hyou:20181101114022j:plain

f:id:cross_hyou:20181101114032j:plain

「家庭用.耐久財」は1970年代は正の相関だったとわかりますね。1980年代からは負の相関というか一方的に「家庭用.耐久財」の価格が下がっている感じです。

「通信」はどうでしょうか?

f:id:cross_hyou:20181101114442j:plain

f:id:cross_hyou:20181101114502j:plain

「通信」も1970年代は正の相関で80年代、90年代は負の相関、2000年代、2010年台は「総合」が変化があまりないのでよくわからないですね。

以上、今回はggplot関数のgeom_point関数で散布図を描きました。

 

 次回は

 

www.crosshyou.info

です。