crosshyou

主にクロス表(分割表)分析をしようかなと思いはじめましたが、あまりクロス表の分析はできず。R言語の練習ブログになっています。

都道府県別のデジタル教科書の整備率のデータの分析3 - R言語のrep関数とseq関数を利用して相関係数マトリックスを加工する。

 

www.crosshyou.info

 の続きです。

2017年度だけのデータフレームを作りました。

f:id:cross_hyou:20210124091638p:plain

cor関数で相関係数マトリックスを作成しました。

f:id:cross_hyou:20210124091742p:plain

pc_sとpc_cの相関係数は0.79と高い強い正の相関があります。dg_hとpc_hは-0.397と負の相関があります。

 

Rによるやさしい統計学

Rによるやさしい統計学

 

 によると、相関係数は

絶対値で0.2以下でほとんど相関なし、

絶対値で0.2~0.4で弱い相関

絶対値で0.4~0.7で中程度の相関

絶対値で0.7以上で強い相関とのことです。

この相関マトリックスだと、どの変数とどの変数の組み合わせが相関が強いのかわかりずらいですね。

なにか工夫して相関係数の高い順に表示してみます。

まず、変数名をcolnames関数で取り出して、保存しておきます。

f:id:cross_hyou:20210124093028p:plain

まず、rep関数でtimes = をつかって、この変数を6回繰り返したベクトルを作ります。

f:id:cross_hyou:20210124093426p:plain

次にrep関数でeach = 6をつかって、それぞれの要素を6回繰り返したベクトルを作ります。

f:id:cross_hyou:20210124093631p:plain

paste関数でこのpair_names1とpair_names2を結合します。

f:id:cross_hyou:20210124094058p:plain

これで変数の組み合わせの文字列のベクトルはできました。

次に、相関係数マトリックスをベクトルにします。as.vector関数でマトリックスがベクトルになります。

f:id:cross_hyou:20210124094245p:plain

data.fame関数でふたつのベクトルからデータフレームを作ります。

f:id:cross_hyou:20210124094506p:plain

filter関数で相関係数が1のものを削除しました。

次に、arrange関数で相関係数の高い順に並び替えます。

f:id:cross_hyou:20210124095440p:plain

2行ずつ、おんなじ組み合わせで順序が逆なものがあるので、1, 3, 5, 7と奇数の行だけにします。

f:id:cross_hyou:20210124100035p:plain

これで完成です。

棒グラフで視覚化してみます。

f:id:cross_hyou:20210124100807p:plain

f:id:cross_hyou:20210124100831p:plain

データフレームを表示して相関係数の高いに表示します。

f:id:cross_hyou:20210124101652p:plain

今回は以上です。

次回は、

 

www.crosshyou.info

 です。

 

はじめから読むには、

 

www.crosshyou.info

 です。