引き続き、
の続きです。前回の分析で「総合」と正の相関が一番強いのが「履物類」、負の相関が一番強いのが「家庭用.耐久財」、無相関に一番近いのが「通信」だとわかりました。
今回はこの3変数の組み合わせで散布図を描いてみたいと思います。R言語のplot関数でも散布図は描けますが、今回は年代によって相関が変わっているかを見てみたいと思いますので、ggplot関数を使ってみたいと思います。
最近、
- 作者: Hadley Wickham,Garrett Grolemund,大橋真也,黒川利明
- 出版社/メーカー: オライリージャパン
- 発売日: 2017/10/25
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (2件) を見る
を買って読み始めましたので、その練習も兼ねています。
まず、「年」のデータから、「年代」のデータを作成します。cut関数です。
breaks <- で区切りを設定し、labelsでそれぞれの区切りの名前を設定しています。そしてcut関数で「年代」の変数を作り、table関数でそれぞれの年代の要素数を表示しました。
ggplot関数を呼び出すためにlibrary(tidyverse)と入力します。
それではggplotで散布図を描きます。
facet_wrapで年代別にパネルを分けています。
「総合」と「家庭用.耐久財」はどうでしょうか?
「家庭用.耐久財」は1970年代は正の相関だったとわかりますね。1980年代からは負の相関というか一方的に「家庭用.耐久財」の価格が下がっている感じです。
「通信」はどうでしょうか?
「通信」も1970年代は正の相関で80年代、90年代は負の相関、2000年代、2010年台は「総合」が変化があまりないのでよくわからないですね。
以上、今回はggplot関数のgeom_point関数で散布図を描きました。
次回は
です。