の続きです。
2017年度だけのデータフレームを作りました。
cor関数で相関係数マトリックスを作成しました。
pc_sとpc_cの相関係数は0.79と高い強い正の相関があります。dg_hとpc_hは-0.397と負の相関があります。
によると、相関係数は
絶対値で0.2以下でほとんど相関なし、
絶対値で0.2~0.4で弱い相関
絶対値で0.4~0.7で中程度の相関
絶対値で0.7以上で強い相関とのことです。
この相関マトリックスだと、どの変数とどの変数の組み合わせが相関が強いのかわかりずらいですね。
なにか工夫して相関係数の高い順に表示してみます。
まず、変数名をcolnames関数で取り出して、保存しておきます。
まず、rep関数でtimes = をつかって、この変数を6回繰り返したベクトルを作ります。
次にrep関数でeach = 6をつかって、それぞれの要素を6回繰り返したベクトルを作ります。
paste関数でこのpair_names1とpair_names2を結合します。
これで変数の組み合わせの文字列のベクトルはできました。
次に、相関係数マトリックスをベクトルにします。as.vector関数でマトリックスがベクトルになります。
data.fame関数でふたつのベクトルからデータフレームを作ります。
filter関数で相関係数が1のものを削除しました。
次に、arrange関数で相関係数の高い順に並び替えます。
2行ずつ、おんなじ組み合わせで順序が逆なものがあるので、1, 3, 5, 7と奇数の行だけにします。
これで完成です。
棒グラフで視覚化してみます。
データフレームを表示して相関係数の高いに表示します。
今回は以上です。
次回は、
です。
はじめから読むには、
です。